卷积层
- 实际上是内积,就是把一个图片分成 n n n 个区域,分别对每个区域用fliter做内积(对应位置相乘,最后求和)
池化层
存在意义
卷积层提取出的特征太多了,要用池化层来进行压缩
策略
- 最大池化 MAX POOLING
- 在某个区域内选取最大的特征值作为这个区域的特征值
应用场景
CV
用到的一些概念
- fliter
- 实质上就是一个参数矩阵,矩阵的每个元素的值的大小都是一个加权数,用来对图像的一个区域进行特征提取
- 对同一个图像进行特征提取可以用很多不同的fliter,每个 fliter 的输出也是一个矩阵,并且为一层特征。所以当使用了很多 fliter 的时候,就会有很多层
- 步长
- 在用fliter做卷积的时候,每个区域之间间隔的距离(或者说每次人为滑动的距离)叫做步长
- 例如一个 3 × 3 3 \times 3 3×3 矩阵(这个矩阵的大小叫做卷积核 )作为 fliter,对一个 5 × 5 5 \times 5 5×5 矩阵做特征提取,步长为 1 1 1,则相当于 3 × 3 3 \times 3 3×3 矩阵每次向右滑动 1 1 1, 1 1 1 行滑动 2 2 2 次就到了下一行,可以滑动 3 3 3 行,最后得出了一个 3 × 3 3 \times3 3×3 的矩阵
- 边缘填充
- 在进行特征提取的时候可以发现,靠近中心的像素,被使用的次数会比边缘的要多,这是因为在滑动的过程中边缘滑一次就过去了,而中间的在滑动的过程中会反复遇见
- 为了解决这个问题,提高边界的重视度,可以在整个图像的外围加一圈全为 0 0 0 的像素,并且把它当作新的图像进行特征提取。 0 0 0 的值保证了他不不会对原图像产生影响,而 0 0 0 作为新边缘又使得原来的边缘靠近了中心,可以被多次提取特征
- 偏置参数
- 每个fliter的卷积核提取后算出来的特征值,都要加上一个偏置参数,这个参数叫做 b b b 参数