首先,直观上看1×1卷积一般是用于三维[C, H, W]或者四维[B, C, H, W]数据,调整了特征图通道数;而全连接层是用于一维或二维数据,对特征图做Flatten拉成一个向量之后,经过矩阵相乘的方式,生成另一个长度的向量
结合pytorch,仔细想想这两个操作本质上是类似的,都可以调整通道维度;
对于1×1卷积,定义:
1×1conv = nn.Conv2d(in_channel, out_channel, 1)
实质上是在特征图的每个位置上执行矩阵向量乘法;
对于全连接层,定义:
Linear = nn.Linear(in_channel, out_channel)
对于一个[B, in_channel, H, W]的四维数据,pytorch中对nn.Linear有如下文档:
说明只会对输入数据的最后一维做矩阵向量乘法,也就是不用再多余进行Flatten操作!
只要将张量的通道维度调整到最后一维,经过线形层后,再将张量各个维度调整回原本顺序即可于1×1卷积实现同样功能。