参考文章:卷积层与池化层、机器视角:长文揭秘图像处理和卷积神经网络架构
一、卷积层
1、什么是卷积?卷积的基本原理
每张图像对应一个特征矩阵,卷积核3*3也是一个矩阵。(卷积核:奇数方阵)
图像矩阵中按顺序(从左到右、从上到下)获得3*3的小矩阵,与卷积核(权值矩阵,过滤器)的对应元素分别相乘,得到9个数,相加,得到一个数。
重复以上步骤,直到图像矩阵的全部元素遍历完。
得到的数,按顺序构成新矩阵。 →“激活映射”→激活图
图1 卷积层工作原理
2、步长(stride):卷积核移动的距离
图1的步长为1,图像规模变小。(步长增加,图像规模变小)
为使得卷积后的激活映射尺寸不变,可以在数据的外层补0(边界padding)(不止一层)
图2 数据四周补0(padding)
3、大多数情况下,不用单一卷积核,而是用维度相同的多个卷积核,输出堆叠,形成图像的纵深维度
(不同卷积核,可以提取到不同的边界特征→不同物体→目标检测)
二、池化层
1、唯一目的:减少图片的空间大小
(在随后的卷积层之间,周期性地引入池化层)
2、常见形式:最大池化(提取最明显特征)、平均池化(将所有像素值相加,再平均)、L2规范池化
3、图像的纵深,保持不变
三、输出层
1、输出层的深度,等于卷积核数量
2、卷积
输出尺寸(长、宽):(W-F+2P)/S+1
W是输入尺寸,F是卷积核尺寸,P是填充数量,S是步长
如:输入图像为32*32*3,卷积核为5*5*3,10个,零填充,单步长。计算得,输出为28*28*10
3、池化
W=W➗kernel_size(按照原理应该是这样子的,但是网上的计算公式又不是··)
四、pooling选择
1、如卷积核为3时 padding 选择1
2、如卷积核为5时 padding 选择2
3、如卷积核为7时 padding 选择3