本文参考:
1*1卷积核的作用_nefetaria的博客-CSDN博客_1*1卷积核的作用
1、多通道卷积说明
首先关于卷积很重要的结论:无论输入图像有多少个通道,输出结果通道数总是等于卷积核个数。
比如上图中,卷积层为1*1*1,最后一个1表示只有一个卷积核,那么最后的输出也是1个通道数。
比如上图中,卷积层为1*1*2,最后一个2表示有2个卷积核,那么最后的输出是2个通道数。
2、1*1卷积的作用
2.1 降维/升维的作用
像多通道的第1个图片说明,输入层3个通道的特征,最后输出层只剩1个通道的信息,也就实现了跨通道的特征整合。
再如上图,上图的1..6就是通道数。RGB是好理解的通道数,三通道是一个图,三通道有各自的像素值最后形成彩图。
对于图像,一般表述为W * H * C,分别表示宽、高、通道数,当想改变通道数时,就用1*1*M(M是新的被改变的通道数),此时W和H的值并未改变。
如果M为1,就像多通道中的第1个示例,实现了跨通道的整合。
如果M小于C,那么就实现了降维的效果。
如果M大于C,那么就实现了升维的效果。
2.2 减少卷积核参数
以GoogLeNet的3a模块为例,输入的feature map是28*28*192,3a模块中1*1卷积通道为64,3*3卷积通道为128,5*5卷积通道为32,如果是左图结构,那么卷积核参数为1×1×192×64+3×3×192×128+5×5×192×32,而右图对3×3和5×5卷积层前分别加入了通道数为96和16的1×1卷积层,这样卷积核参数就变成了1×1×192×64+(1×1×192×96+3×3×96×128)+(1×1×192×16+5×5×16×32),参数大约减少到原来的三分之一。
注意:卷积核如果实现通道数的改变,那么必定是通过映射矩阵完成的,比如从M维变到N维,则映射矩阵为M*N。