卷积定义:卷积是一种数学算子
连续性定义
离散型定义
物理意义:一个函数放在另一个函数上的加权叠加
理解卷积:
- 把一个点的像素值用它周围的点的像素值加权平均来代替
- 用一个模版和一幅图作卷积,对于图像上每一个点,将模版原点与之对齐(重合),然后将模版的点与图像上的点对应相乘,再相加得到该点的卷积值
可借助下图理解(图片来源于:https://mlnotebook.github.io/post/CNN1/)
感受野:卷积神经网络每一层输出的特征图(feature map)上每个像素点在原始图像上映射的区域大小。(这里的原始图像指的是网络的输入图像,是经过预处理后的图像。)
神经元无法对原始图像的所有信息进行感知,是因为在卷积神经网络中普遍使用卷积层和pooling层,在层与层之间均为局部连接。
神经元感受野的值越大表示其能接触到的原始图像范围就越大,也意味着它可能蕴含更为全局,语义层次更高的特征;相反,值越小则表示其所包含的特征越趋向局部和细节。因此感受野的值可以用来大致判断每一层的抽象层次。
卷积核:卷积核是图像处理时,给定输入图像,在输出图像中每一个像素是输入图像中一个小区域中像素的加权平均,其中权值由一个函数定义,这个函数称为卷积核。上面讲到的处理图像的模版就是卷积核,也称为特征检测器、权重矩阵或系数矩阵。
确定卷积核的大小:
在达到相同感受野的情况下,卷积核越小,所需要的参数和计算量越小。
具体来说。卷积核大小必须大于1才有提升感受野的作用,1排除了。而大小为偶数的卷积核即使对称地加padding也不能保证输入feature map尺寸和输出feature map尺寸不变(画个图算一下就可以发现),2排除了。所以一般都用3作为卷积核大小。
卷积核的具体应用可参考:https://blog.csdn.net/m0_38032942/article/details/82230059
卷积核总结:
- 像素矩阵值相加<1,图像变暗,值越小越暗
- 像素值相加为1时,处理后的图像亮度几乎不变
- 像素值相加>1时,亮度增大,值越大越亮
- 对于旋转对称矩阵的卷积核:卷积操作=对应元素相乘再相加
- 对于一般的卷积核:卷积操作=顺时针旋转180度+对应元素相乘再相加(有时也可不旋转)
- 对于上下左右的边缘像素常常在卷积中忽略不计