1.“卷积”
用表示人的进食情况,用
表示消化情况,带进去计算就能得到这个人在下午2点还剩多少食物。
以上是特殊时刻,现在求t时刻胃里面还剩多少东西:积分表示看前面所有点的时刻每一个点到了t时刻还能剩多少。
判断是不是卷积的重要标志:这两个的自变量相加之后,x被消掉了
这里是f是指什么时候吃的,那越往前的点消化时间越久,对应到g上就越往后。每一条连线都意味着一对f(x)和g(t-x)相乘。
卷积:把g函数翻转计算
2.“卷积神经网络”
以上我们可以知道卷积的物理意义:一个系统输入不稳定、输出稳定,可用卷积求系统存量。
卷积神经网络的主要作用:用它识别图片里面的内容,如挑出图片的猫。之所以叫“卷积神经网络”,就是把图片交给神经网络之前,先要对图像进行卷积操作。
①什么是图片的卷积操作?找系统的f和g,最后求系统的存量
f函数:不稳定的输入——吃东西
g函数:稳定的输出——消化
另一种理解:卷积看做飓风发生的时候蝴蝶煽动翅膀对自己产生多少影响。
②蝴蝶煽动翅膀这件事会对t时刻发生飓风产生影响,这个影响会随着时间的变化发生变化的。卷积处理的实际上是飓风发生的时候之前蝴蝶煽动翅膀对自己产生多大的影响。
某一时刻发生了一件事,而这一件事的产生受到之前发生的很多事情的影响,具体怎么影响要看从x时刻到t时刻所经历的时间,这个影响会随着时间去变化。
规定随时间如何变化的就是g函数,g函数规定了之前发生的一些事情随时间,它的影响力是如何变化的(影响力都是逐渐减小的,但也有可能是增长,有可能不是随着时间变化的是随着距离变化的,如在一个位置发生了一件事,对这个位置产生影响的是其他的很多位置,g函数的横坐标就是距离)。
图像卷积操作:用一个3*3的点阵和图像进行操作,3*3的点阵被称为卷积核。具体过程是把卷积核扣在图像的点阵上,然后与对应的格子相乘,3*3的点阵有9个数相乘,最后把这9个相乘的结果相加保存在一起,相当于得到了一个新的像素点。
整个过程是先相乘再相加的过程。计算完了之后就得到了新的像素值,接下来需要用卷积核把整个图像都扫描一遍,这就是卷积操作后的新图像。
这样处理之后的图像总是少了一圈,需要在处理之前给图像外面加一圈都是0的像素,就能得到同样大小的图片了。
,整个过程是先相乘再相加的过程,图像和卷积核一个是f一个是g?
图像f:像素点是总在变化的,因为f对应的是一个系统的不稳定的输入
卷积核g:稳定的输出
实际上根据第二种理解,图像的卷积操作是在看很多像素点对某一个像素点是如何产生影响的。卷积核,这个3*3的点阵,里面的数字不一样,最后处理的图像的效果也不一样。右面这个卷积核本质上就是找到一个像素点,把它周围的像素点都加起来,求原样本的核内加权均值,最后效果就是可以让图像变得更加平滑、更朦胧,所以叫做平滑卷积操作。
平滑卷积操作之后的效果:
平滑的本质就是让周围的像素点和自己相差不大,求平均值:周围的像素点和你这个像素点相比,看它的数值是不是太高了,如果太高了就拉低一点,太低了就拉高一点。
卷积核实际上规定了周围的(一圈3*3)像素点如何对当前像素点产生影响的。
理论上来讲可以从无限远处对当前像素点产生影响。
g函数只有旋转180°才是卷积核,卷积核可以扣在图像上之间相乘再相加(省略了旋转这个步骤),本质上仍然是一个卷积运算。
再次理解图像卷积的本质:一个像素点和周围像素点的关系
①卷积:过去对现在的影响——周围像素点对当前像素点产生的影响
②g函数:规定了如何影响
卷积神经网络的第一层是什么?和卷积有什么关系?卷积神经网络一般是做图像识别的,
两边的图像不同,但是局部是有相同的地方的,所以卷积神经网络识别图像的第一步就是挑出图像的局部特征。
这个过程就是对图像进行卷积操作:
①处理一个像素点和周围像素点的关系:周围像素点对当前像素点产生的影响
②提取局部特征:卷积操作不止有平滑卷积核,还有各种:最后得到的图像中只把垂直方向的边界挑出来了,而忽略了横向的边界。
如果挑选的卷积核合适,可以对图片进行过滤,把某些特征保存下来,其他的特征被过滤掉了,这种卷积核叫做过滤器。
相乘再相加可以看做是自己周围像素点的一个试探,卷积核就是试探的模版,不像考虑某个位置,就把他设置成0,重点考虑的位置就可以把数值设置的比较高。
识别x的问题:利用三个卷积核,把三个特征找出来