当 n 个深度为1的2D矩阵叠加起来,称为一个layer。比如,三通道的RGB图像称为三个channel构成的一个layer。
layer 和 channel 是一组,kernel 和 filter 是一组。
layer和channel又用于描述输入和输出。kernel 和 filter 用于描述卷积核。
channel用于描述layer的深度,channel=3,即layer的feature map有三层。
kernel用于描述filter的数量,kernel=k,即filter有k个kernel,对应k个“特征”。
kernel的数量和channel又存在对应关系:
in_channel决定了filter的kernel数量,filter的数量决定了out_channel的数量。如果觉得某一层的特征提取不足,可多用几个卷积核提高特征提取能力。
写的很好的博客可以参考: