卷积的数学定义,图像理解及背后的意义

 上次组会上讲了一下CNN,没想到老师提问了很多关于CNN为什么要这样的问题。为什么要卷积,卷积是什么,卷积的意义,为什么要有卷积层,激活层,池化层,以及为什么这些层的作用是这样的。几个问题问的我哑口无言。所以深入了解了一下。人常说如果你能讲给别人听,就是理解到位了。所以在此做个总结,一方面记录自己的想法,一方面锻炼一下打字能力,毕竟要敲代码的,打字不快怎么能行。

卷积的数学定义:

离散形式:

可以看到,本质是对两个函数的积进行求和,只不过其中一个函数在原来的基础上进行了翻转和平移,不同程度的平移量造成的一系列运算结果构成了卷积函数。

至于为什么要叫卷积?

我的理解是”卷“这个字就表示了翻转再平移的过程,想象一下如果把一张纸对折,这对应翻转,再把对折后的一端向着对折的那条折痕往里塞,这对应平移。两个动作合二为一就会发现,这就是卷纸的过程。

所以,先 卷 后 积,此为卷积。

具体的例子的话可以举两个,一个是信号分析中的例子,一个是图像处理的例子。具体可以参考知乎的这位答主,他给出了详细的介绍和公式推导。

如何通俗易懂地解释卷积? - palet的回答 - 知乎 https://www.zhihu.com/question/22298352/answer/637156871

我在此记录一下我的理解。正如这位答主举得例子,如果输入信号f(tao)给到某个系统中,会按照某中规律进行衰减,这个衰减因子就是g(tao),由于输入是连续的,所以我们计算某一时刻的输出时,就不能单纯的用这一时刻的输入乘以衰减因子g(tao),因为这一时刻之前的输入在输出端的影响虽然衰减了,但还是存在的,即此时刻的输出是此时刻之前的输入和此时刻的输入的累加。

所以为了使此时刻之前的输入也计算在内,我们将g(tao)翻转为g(-tao),同时在平移x距离,其中x的值就是上面提到的”某一时刻“,于是某一时刻的输出h(x) = 输入与”卷“过后的衰减因子的重叠部分乘积的积分。

第二个就是图像处理中的例子。卷积的离散形式可以看作是加权求和,其中g(n)就是权重,f(n)就是输入。在图像处理邻域,卷积核即可看为翻转平移过后的权重系数矩阵,输入图像的像素矩阵即可看作输入,故图像处理即是二维状态的的离散卷积。其意义是图像某点的像素值是会受到周围点的像素值的影响的,所以我们对图像进行处理的时候,就不能只关注一个点,而是应该考虑这个点附近点的像素值,这就像是上一个例子我们不能只考虑当前时刻,也要考虑当前时刻之前的时刻。所以使用一个矩阵来对输入图像进行加权求和,故改矩阵被称为卷积核。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值