如何通俗易懂地解释卷积?

时间: 2024-03-08 23:29:39 |   作者: 屏蔽类电源滤波器

产品详情

  卷积这个概念,很早以前就学过,但是始终没搞懂。教科书上通常会给出定义,给出很多性质,也会用实例和图形进行解释,但究竟为何需要这么设计,这么计算,背后的意义是什么,往往语焉不详。作为一个学物理出身的人,一个公式倘若倘若给不出结合实际的直观的通俗的解释(也就是背后的“物理”意义),就觉得少了点什么,觉得不是真的懂了。

  并且也解释了,先对g函数进行翻转,相当于在数轴上把g函数从右边褶到左边去,也就是卷积的“卷”的由来。

  然后再把g函数平移到n,在这一个位置对两个函数的对应点相乘,然后相加,这样的一个过程是卷积的“积”的过程。

  这个只是从计算的方式上对公式进行了解释,从数学上讲无可挑剔,但进一步追问,为何需要先翻转再平移,这么设计有何用意?还是有点费解。

  在知乎,已经很多的热心网友对卷积举了很多形象的例子进行了解释,如卷地毯、丢骰子、打耳光、存钱等等。读完觉得非常生动有趣,但过细想想,还是感觉有些地方还是没解释清楚,甚至有可能还有瑕疵,或者还可以改进(这些后面我会做一些分析)。

  带着问题想了两个晚上,终于觉得有些问题想通了,所以就写出来跟网友分享,一同学习提高。不对的地方欢迎评论拍砖。。。

  一个输入信号f(t),经过一个线性系统(其特征可以用单位冲击响应函数g(t)描述)以后,输出信号应该是什么?实际上通过卷积运算就能够获得输出信号。

  输入一幅图像f(x,y),经过特定设计的卷积核g(x,y)进行卷积处理以后,输出图像将会得到模糊,边缘强化等各种效果。

  对卷积这个名词的理解:所谓两个函数的卷积,本质上是先将一个函数翻转,接着进行滑动叠加。

  在连续情况下,叠加指的是对两个函数的乘积求积分,在离散情况下就是加权求和,为简单起见就统一称为叠加。

  翻转——>

  滑动——>

  叠加——>

  滑动——>

  叠加——>

  滑动——>

  叠加.....

  卷积的“卷”,指的的函数的翻转,从 g(t) 变成 g(-t) 的这个过程;同时,“卷”还有滑动的意味在里面(吸取了网友李文清的建议)。如果把卷积翻译为“褶积”,那么这个“褶”字就只有翻转的含义了。

  有些文章只强调滑动叠加求和,而没有说函数的翻转,我觉得是不全面的;有的文章对“卷”的理解其实是“积”,我觉得是张冠李戴。

  1. 从“积”的过程能够正常的看到,我们得到的叠加值,是个全局的概念。以信号分析为例,卷积的结果是不仅跟当前时刻输入信号的响应值有关,也跟过去所有时刻输入信号的响应都有关系,考虑了对过去的所有输入的效果的累积。在图像处理的中,卷积处理的结果,实际上的意思就是把每个像素周边的,甚至是整个图像的像素都考虑进来,对当前像素进行某种加权处理。所以说,“积”是全局概念,或是说一种“混合”,把两个函数在时间或者空间上进行混合。

  2. 那为何需要进行“卷”?直接相乘不好吗?我的理解,进行“卷”(翻转)的目的其实是施加一种约束,它指定了在“积”的时候以什么为参照。在信号分析的场景,它指定了在哪个特定时间点的前后进行“积”,在空间分析的场景,它指定了在哪个位置的周边进行累积处理。

  如下图所示,输入信号是 f(t) ,是随时间变化的。系统响应函数是 g(t) ,图中的响应函数是随时间指数下降的,它的物理意义是说:如果在 t=0 的时刻有一个输入,那么跟着时间的流逝,这个输入将不断衰减。换言之,到了 t=T时刻,原来在 t=0 时刻的输入f(0)的值将衰减为f(0)g(T)。

  考虑到信号是连续输入的,也就是说,每个时刻都有新的信号进来,所以,最终输出的是所有之前输入信号的累积效果。如下图所示,在T=10时刻,输出结果跟图中带标记的区域整体有关。其中,f(10)因为是刚输入的,所以其输出结果应该是f(10)g(0),而时刻t=9的输入f(9),只经过了1个时间单位的衰减,所以产生的输出应该是 f(9)g(1),如此类推,即图中虚线所描述的关系。这些对应点相乘然后累加,就是T=10时刻的输出信号值,这个结果也是f和g两个函数在T=10时刻的卷积值。

  显然,上面的对应关系看上去比较难看,是拧着的,所以,我们把g函数对折一下,变成了g(-t),这样就好看一些了。看到了吗?这就是为什么卷积要“卷”,要翻转的原因,这是从它的物理意义中给出的。

  上图虽然没有拧着,已经顺过来了,但看上去还有点错位,所以再进一步平移T个单位,就是下图。它就是本文开始给出的卷积定义的一种图形的表述:

  所以,在以上计算T时刻的卷积时,要维持的约束就是:t+ (T-t) = T  。这种约束的意义,你们可以自己体会。

  在本问题 如何通俗易懂地解释卷积?中排名第一的马同学在中举了一个很好的例子(下面的一些图摘自马同学的文章,在此表示感谢),用丢骰子说明了卷积的应用。

  要解决的问题是:有两枚骰子,把它们都抛出去,两枚骰子点数加起来为4的概率是多少?

  分析一下,两枚骰子点数加起来为4的情况有三种情况:1+3=4, 2+2=4, 3+1=4

  首先,因为两个骰子的点数和是4,为满足这个约束条件,我们仍旧是把函数 g 翻转一下,然后阴影区域上下对应的数相乘,然后累加,相当于求自变量为4的卷积值,如下图所示:

  进一步,如此翻转以后,可以方便地进行推广去求两个骰子点数和为 n 时的概率,为f 和 g的卷积 f*g(n),如下图所示:

  由上图能够正常的看到,函数 g 的滑动,带来的是点数和的增大。这个例子中对f和g的约束条件就是点数和,它也是卷积函数的自变量。有兴趣还可以算算,如果骰子的每个点数出现的概率是均等的,那么两个骰子的点数和n=7的时候,概率最大。

  还是引用知乎问题 如何通俗易懂地解释卷积?中马同学的例子。图像可以表示为矩阵形式(下图摘自马同学的文章):

  对图像的处理函数(如平滑,或者边缘提取),也可以用一个g矩阵来表示,如:

  然后将图像处理矩阵翻转(这个翻转有点意思,不是延x轴和y轴两个方向翻转,而是沿右上到左下的对角线翻转,这是为了凑后面的内积公式。),如下:

  请注意,以上公式有一个特点,做乘法的两个对应变量a,b的下标之和都是(u,v),其目的是对这种加权求和进行一种约束。这也是怎么回事要将矩阵g进行翻转的原因。以上矩阵下标之所以那么写,并且进行了翻转,是为了让大家更清楚地看到跟卷积的关系。这样做的好处是便于推广,也便于理解其物理意义。实际在计算的时候,都是用翻转以后的矩阵,直接求矩阵内积就可以了。

  以上计算的是(u,v)处的卷积,延x轴或者y轴滑动,就可以求出图像中各个位置的卷积,其输出结果是处理以后的图像(即经过平滑、边缘提取等各种处理的图像)。

  再深入思考一下,在算图像卷积的时候,我们是直接在原始图像矩阵中取了(u,v)处的矩阵,为何需要取这个位置的矩阵,本质上其实是为了满足以上的约束。因为我们要算(u,v)处的卷积,而g矩阵是3x3的矩阵,要满足下标跟这个3x3矩阵的和是(u,v),只能是取原始图像中以(u,v)为中心的这个3x3矩阵,即图中的阴影区域的矩阵。

  推而广之,如果如果g矩阵不是3x3,而是6x6,那我们就要在原始图像中取以(u,v)为中心的6x6矩阵进行计算。由此可见,这种卷积就是把原始图像中的相邻像素都考虑进来,进行混合。相邻的区域范围取决于g矩阵的维度,维度越大,涉及的周边像素越多。而矩阵的设计,则决定了这种混合输出的图像跟原始图像比,究竟是模糊了,还是更锐利了。

  比如说,如下图像处理矩阵将使得图像变得更为平滑,显得更模糊,因为它联合周边像素进行了平均处理:

  而如下图像处理矩阵将使得像素值变化明显的地方更为明显,强化边缘,而变化平缓的地方没有影响,达到提取边缘的目的:

  上面一些对卷积的形象解释,如知乎问题 卷积为什么叫「卷」积?中荆哲以及问题 如何通俗易懂地解释卷积?中马同学等人提出的如下比喻:

  其实图中“卷”的方向,是沿该方向进行积分求和的方向,并无翻转之意。因此,这种解释,并没有完整描述卷积的含义,对“卷”的理解值得商榷。

  声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。举报投诉

  离开无线,就无所谓射频。 我们今天所说的Radio Frequency RF就是指电磁波中这段能够用于无线通信的电磁波频谱。 无线信号能够以电磁波为载体进行传输,就像光线一样,脱离实物载体,实现无线传输,唯一不同的是频率和波长。

  ,缩略语中英文全称3GPP3rd Generation Partnership Project第三代合作伙伴计划5GC5G Core Network5G核心网AAUActive Anten...

  本帖最后由 hobbye501 于 2016-7-18 20:52 编辑

  之电子称开发硬件篇:即前篇之后,按照我们一贯的开发流程,显示硬件,后是软件,最后连调综合实验。下面我们先重点讲

  本帖最后由 hobbye501 于 2016-7-18 20:40 编辑

  之电子称开发立项篇:就是说我们要开发一个项目的前期功能与选型,功能: 1.实时称重并显示; 2.限位控制

  之电子称开发软件篇 :程序才是一个项目的灵魂,就像心于人一样。。。前两篇链接:

  本帖最后由 Calvin248 于 2013-5-5 15:31 编辑 帮助大家更好的理解PID算法,讲解的很

  `看看这12本漫画书全都是岛国人的产品,有时还真不得不佩服他们的创意,把非常多的知识全都用漫画故事的形式展现出来,有漫画电磁学,漫画电学原理,漫画傅里叶解析,漫画虚数和复数,等等等等。看了书名就知道,这些漫画书全都是为电子工程师量身打造的,今天分享给大家,尤其是单身工程师们。要的回复吧`

  很多同学都不清楚PID是个什么东西,因为很多不是自动化的学生。他们开口就要资料,要程序。这是明显的学习方法不对,起码,首先,你要理解PID是个什么东西。首先,为何需要做PID?由于外界原因,小车的实际速度有时不稳定,这是其一,要让小车以最快的时间达达到既定的目标速度,这是其二。速度控制管理系统是闭环,才能满足总系统的稳定要求,必竟速度是系统参数之一,这是其三.小车调速肯定不是线性的,外因那么多,没人能证明是线性的。如果是线性的,直接用P就可以了。比如在PWM=60%时,速度是2M/S,那么你要它3M/S,就把PWM提高到90%。因为90/60=3/2,这样一来太完美了。完美是不可能的。那么不是线性的,要怎么怎么控制PWM使速度达到即定的速度呢?即要快,又要准,又要狠。(即快准狠)系统这个速度的调整过程就一定要通过某个算法调整,一般PID就是这一个所用的算法。可能你会想到,如果通过编码器测得现在的速度是2.0m/s,要达到2.3m/s的速度,那么我把pwm增大一点不就行了吗?是的,增大pwm多少呢?必须要通过算法,因为PWM和速度是个啥关系,对于总系统来说,谁也不知道。要一点一点的试,加个1%,不够,再加1%还是不够,那么第三次你还会加1%吗?有很大的可能性就加2%了。通过PID三个参数得到一个表达式:△PWM=a *△V1+b *△V2+c *△V3,a b c是通过PID的那个长长的公式展开,然后约简后的数字,△V1 ,△V2 ,△V3 此前第一次调整后的速度差 ,第二次调整后的速度差,第三次。。。。。一句话,PID要使当前速度达到目标速度最快,要建立如何调整pwm和速度之间的关系。输入输出是什么输入就是前次速度,前前次速度,前前前次速度。输出就是你的PWM应该增加或减小多少。控制模型:你控制一个人让他以PID控制的方式走110步后停下。(1)P比例控制,就是让他走110步,他按照一定的步伐走到一百零几步(如108步)或100多步(如112步)就停了。说明P比例控制是一种最简单的控制方式。其控制器的输出与输入误差信号成比例关系。当仅有比例控制时系统输出存在稳态误差(Steady-state error)。(2)PI积分控制,就是他按照一定的步伐走到112步然后回头接着走,走到108步位置时,然后又回头向110步位置走。在110步位置处来回晃几次,最后停在110步的位置。说明在积分I控制中,控制器的输出与输入误差信号的积分成正比关系。对一个自动控制管理系统,如果在进入稳态后存在稳态误差,则称这个控制系统是有稳态误差的或简称有差系统(System with Steady-state Error)。为了消除稳态误差,在控制器中必须引入“积分项”。积分项对误差取决于时间的积分,跟着时间的增加,积分项会增大。这样,即便误差很小,积分项也会跟着时间的增加而加大,它推动控制器的输出增大使稳态误差进一步减小,直到等于零。因此,比例+积分(PI)控制器,可以使系统在进入稳态后无稳态误差。(3)PD微分控制,就是他按照一定的步伐走到一百零几步后,再慢慢地向110步的位置靠近,如果最后能精确停在110步的位置,就是无静差控制;如果停在110步附近(如109步或111步位置),就是有静差控制。说明在微分控制D中,控制器的输出与输入误差信号的微分(即误差的变化率)成正比关系。自动控制系统在克服误差的调节过程中有极大几率会出现振荡甚至失稳,其原因是由于存在有较大惯性组件(环节)或有滞后(delay)组件,具有抑制误差的作用,其变化总是落后于误差的变化。解决的办法是使抑制误差作用的变化“超前”,即在误差接近零时,抑制误差的作用就应该是零。这就是说,在控制器中仅引入“比例P”项往往是不够的,比例项的作用仅是放大误差的幅值,而目前要增加的是“微分项”,它能预测误差变化的趋势。这样,具有比例+微分的控制器,就能够提前使抑制误差的控制作用等于零,甚至为负值,从而避免了被控量的严重超调。所以对有较大惯性或滞后的被控对象,比例P+微分D(PD)控制器能改善系统在调节过程中的动态特性。

  的话讲解电源知识的文章,分别是关于三极管、电阻、电容、电感、二极管和场效应管的讲解。怕想学习的坛友找不到内容,所以这边整合一下,给大家伙儿一起来分享文章的链接。用

  ,推荐大家下载学习!内容太大,打包4个压缩包。内容有:1 AD采集 2 FIR滤波器设计3 信号发生器4 VGA...............等十多个案例分析。

  的这段时间里,凡和边缘计算沾边的上市公司股票价格均多日涨停,关于边缘计算的文章阅读量暴增几倍。到底是怎样的魔力,让大家突然间关注边缘计算,而这个概念下的产品又有怎样的功能和应用场景,谁又在这个万亿级别的市场中已经掌握先机?本文就以上问题给读者一个

  ` 本帖最后由 tosharp 于 2012-7-25 15:45 编辑 史上最容

  Modbus是一种工业协议,于1979年开发,旨在实现自动化设备之间的通信。本章采用

  Modbus的通信原理,最重要的包含Modbus-RTU协议以及Modbus-ASCLL协议。

  开此帖目的是,是让更多爱好学习开关电源的人.从中学习到书本中不能理解的知识,能得到大侠们

  解答,真正对电源设计应用的理解与撑握.将自己以经理解了,讲给大家,让更多人理解.先介绍一下本人,本人也

  的程序吧,要用138和595控制的16x16点阵左移程序。在此谢过了!

  有什么用 什么是傅利叶变换 什么是拉普拉斯变换 引子很多朋友和我一样,工科电子类专业,学了一堆信号方面的课,什么都没

  ,以讲故事为例,由浅而深,只要稍懂电子知识的人都能看懂,使我这个大学里听不懂单片机课的人终于入了门。不知道LED驱动电源有没有这样的书呢?最好是非常详细的

  ,以讲故事为例,由浅而深,只要稍懂电子知识的人都能看懂,使我这个大学里听不懂单片机课的人终于入了门。不知道LED驱动电源有没有这样的书呢?最好是非常详细的

  地讲解门电路,对于理解CPU的与非或等门电路、触发器和寄存器有很大帮助】PS:很久之前看的文章了,现在翻出来看看,对于门电路理解很有裨益,也是CPU设计的基础阅读

  啊?本人c语言入门用的谭浩强的,后来发现编程不规范,又去看的c程序设计。

  本帖最后由 一只耳朵怪 于 2018-6-13 15:41 编辑 请用一句话

  的讲下这些协议有哪些特点?RS485 232422MODBUS 蓝牙 ZIGBEE红外 以太网TCP/IPHART 串口MPIUARTCANBUS profibus ASI PPIUDP、S7、profibus、pofinet ,,,等等 欢迎补充

  的《路由和交换》 路由和交换是网络世界中两个重要的概念。传统的交换发生在网络的第二层,即数据链路层,而路由则发

  ) · 导语 2010年,您是否有购买笔记本的计划?作为一款对多数人来说都价格不

  区块链如何运作的? 下面这篇文翻译自How Does the Blockchain Work?全文。作者Michele DAliessi用

  场效应管具有输入电阻高(107~1015Ω)、噪声小、功耗低、动态范围大、易于集成、没有二次击穿现象、安全工作区域宽等优点,现在已经成为双极型晶体管和功率晶体管的强大竞争者。用

  贝叶斯网络和它的应用?详情请看下文。贝叶斯网络是一个用严格的数学方法来模拟一个世界的方法,是灵活的,适应于任何你拥有的知识程度的方法,同时也是计算效率的方法。

  机器学习基本概念时最有启发性的条目列表。 1. Test and training error: 为什么低训练误差并不总是一件好的事情呢:以模型复杂度为变量的测试及训练错误

  相信网上现在有很多关于FFT的教程,我曾经也参阅了很多网上的教程,感觉都不怎么

  “中心化”作为一种机制的优势有很多,能大大的提升效率、集合资源、迅速建立起秩序等。

  ,似乎默认所有读者都有相关基础。这篇外文既友好又深入,所以翻译了过来。文章高级部分通过流体力学量子力学等

  的传播,设身处地以用户思维进行优质的内容生产,从而打造具有影响力、契合新媒体传播语境的爆款作品,一直是传统主流媒体展示媒体融合创新成果的重要舞台。

  01 工厂方法 追 MM 少不了请吃饭了,麦当劳的鸡翅和肯德基的鸡翅都是 MM 爱吃的东西,虽然口味不一样,但不管你带 MM 去麦当劳或肯德基,只管向服务员说「来四个鸡翅」就行了。麦当劳和肯德基就是生产鸡翅的 Factory 工厂模式:客户类和工厂类分开。 消费者任何一个时间里需要某种产品,只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时,工厂类也要做相应的修改。如:如何创建及如何向客户端提供。 02 建造者模式 MM 最爱

  !资料下载的电子资料下载,更有其他相关的电路图、源代码、课件教程、中文资料、英文资料、参考设计、用户指南、解决方案等资料,希望有机会能够帮助到广大的电子工程师们。

  ,看完你也会啊!资料下载的电子资料下载,更有其他相关的电路图、源代码、课件教程、中文资料、英文资料、参考设计、用户指南、解决方案等资料,希望能够在一定程度上帮助到广大的电子工程师们。

  !资料下载的电子资料下载,更有其他相关的电路图、源代码、课件教程、中文资料、英文资料、参考设计、用户指南、解决方案等资料,希望有机会能够帮助到广大的电子工程师们。

  学过电力电子的小伙伴们都知道…交流电“整流”为直流电(a)…直流电“逆变”为交流电(b)…交流电“变压”为交流电(c)…直流电“斩波”为直流电(d)…“变压”(c)暂且不谈…这是变压器制...

  的电脑电源选购知识指南一、电源品牌电源品牌众多,例如海盗船、安钛克、全汉、台达、振华、酷...

  所以,在大多数场合中,用“开关量”来控制一个物理量,就显得比较简单粗暴了。有时候,是无法保持稳定的。因为单片机、传感器不是无限快的,采集、控制需要时间。

  收集NLP各种任务的数据集,加上任务描述和提示组装成新的数据集,并使用这些数据微调预训练的大型语言模型。包括指令微调和有监督微调。

  的语句介绍LC光纤快速连接器”由德索连接器为您编辑整理,采购连接器,上德索。光纤快速连接器是一种灵活的设备,可以快速连接和断开光纤电缆。有多种类型的光纤快速连接器可以选择,包括LC光纤

  上图所示的是电脑显示屏的微观图像,拍摄的方法非常有意思,通过在手机摄像头上滴一滴水滴,形成凸透镜,就能做成一个简易版的显微镜。

  操作是一种数学上的操作,它可以将两个函数f和生第三个函数h。在机器

  。CNN能够在一定程度上帮助人们实现许多有趣的任务,如图像分类、物体检测、语音识别、自然语言处理和视频分析等。本文将详细介绍

  神经网络是一个由神经元构成的深度神经网络,由输入层、隐藏层和输出层组成。在

  傅里叶变换(Fourier Transform,简称FFT)是一个大范围的应用的数学工具,它可以将一个连续或离散信号分解成一系列单一的正弦函数,这些正弦函数名称为频率成分

其他产品
热门产品