1 卷积
比如输入的是200* 200 * 3的图像咱们用5 * 5 * 3 * 48的卷积核组进行卷积
(总共有48个卷积核,48前头的3主要是和输入图像的三维想对应的)
此时咱们会得到200 * 200 * 48的矩阵
(这48个200*200的矩阵就是
特征响应矩阵
用来存储上边每个卷积核想要收集的纹理,比如第一个卷积核收集x方向的纹理)
综上所述:卷积后的矩阵就是用来存对应卷积核想要提取的特征信息
越往后的卷积层的卷积核提取的特征越复杂,比如刚开始两层可能提取的是的就是直线,圆弧啥的,而最后几层提取的坤宁宫就是人脸轮廓,胳膊轮廓啥的了
也可以这么理解就是把全连接前边的**卷积操作**当场一个复杂的卷积核组,它负责把输入图像卷积成256个(这个256是按上图说的真实情况不一定是多少)**特征响应图**
两个3*3的感受野和一个5*5的卷积核一样,但是运算量小了,非线性更强了
1.1 计算卷积后矩阵宽高(没有边界填充)
W2 =(W1 -F)/S +1
H2 =(H1 -F)/S +1
F——卷积核尺寸
S——卷积步长(stride)
1.2 计算卷积后矩阵宽高(有边界填充)
W2 =(W1 -F+2P)/S +1
H2 =(H1 -F+2P)/S +1
F——卷积核尺寸
S——卷积步长(stride)
P——边际填充
1.3 设计卷积核时候需要考虑的事
卷积核的宽高
是否采用边界填充
卷积步长
卷积核的个数
2 池化
作用:对每一个特征响应图独立进行(这点和卷积不一样),减低特征响应图组中每个特征响应图的宽度和高度,减少后续需要训练的参数数量,不仅可以降低训练资源的消耗,同时也可以控制过拟合
2.1 常见的池化操作
最大池化——使用区域内最大值代表这个区域(有点类似非极大化抑制可以保留最强的信息)
平均池化——使用区域内所有值的均值代表这个区域
2.2 池化层时候需要考虑的事
池化窗口
池化步长