1. 对于一个channel的图像,卷积计算很简单
例如:若有10个卷积核,则卷积输出10个feature map
一个卷积核得到的特征提取是不充分的,我们可以添加多个卷积核,比如32个卷积核,从而可以学习32种特征。
2. 对多个channel的图像
与单channel卷积有个共同点需要记住:有几个卷积核,就会输出几个Feature map
- 简而言之,在某个卷积层中,可以有多个卷积核:下一层需要多少个feather map,本层就需要多少个卷积核
举例:
输入图片尺寸:高度 H ,宽度 W,图片channel C,一般使用RGB三通道。
卷积核: 卷积核大小 K * K,由于输入图片的channel是 C,因此卷积核就是 K * K * C 大小的。这里需要记住,卷积核的
最后一维一定跟输入图片的channel是相同的。
对于RGB三通道图像,在指定kernel_size的前提下,真正的卷积核大小是kernel_size*kernel_size * 3。
卷积过程:对一个卷积核kernel_size*kernel_size * 3,在各个channel上分别执行二维卷积,然后将各个channel的相加,最终得到的是一个 二维卷积结果。
举例而言,对7x7x3这种RGB三通道的输入是如何卷积的?
7x7x3的张量,卷积核W0也必须最后一维是3的张量,这里卷积核W0的单个子矩阵维度为3x3。那么卷积核W0实际上是一个3x3x3的张量。卷积过程:这里是张量的卷积,即两个张量的3个子矩阵卷积后,再把卷积的结果相加后再加上偏倚b。得到一个卷积结果。步幅Stride为2、有两个卷积核W0和W1,则卷积结果为:卷积的结果是一个3x3x2的张量。