二、三维卷积
大部分图像不只想灰度图像只有一层数值阵列,更多的是在RGB三个通道有着三层数值阵列。所以可以抽象为6*6*3:
那么filter为了提取三个通道的综合特征,也必须为3*3*3:
卷积计算则变成对应维度的3*3与6*6相应数值相乘,最后不是9个数字相加,而是三个维度的对应27个数字相加。在步长为1且不填充下,同样得到4*4*1的数值阵列。
如果想要得到多个特征,则需要增加3*3*3的filter数量。若用2个3*3*3的filter对原数据进行卷积运算,则结果为4*4*2。
三、池化层
池化可以使数据减少展示量提高运算速度,并是特征检测变得强大。
假设输入4*4原数据,步长为2,则会将原始数据分为4部分,对每部分做相应的操作得到2*2的池化层。
====>
假设对每部分做取最大值的操作,则叫做最大值池化
假设对每部分做取均值的操作,则叫做均值池化