1×1卷积核的作用

最新推荐文章于 2024-10-12 17:30:49 发布

LL.。

最新推荐文章于 2024-10-12 17:30:49 发布

阅读量913

点赞数 23

分类专栏：深度学习文章标签：深度学习神经网络 cnn

本文链接：https://blog.csdn.net/qq_53243414/article/details/142185739

版权

1 篇文章 0 订阅

订阅专栏

卷积核的第 1 通道与输入特征图的第 1 通道进行卷积
卷积核的第 2 通道与输入特征图的第 2 通道进行卷积。
依次类推，卷积核的每个通道分别与对应的输入特征图通道进行操作。
在每个通道的卷积计算上，卷积核的窗口在特征图上滑动，卷积核与输入特征的对应位置做逐元素相乘，再将结果累加，产生一个数值。最后得到一个二维矩阵。

跨通道求和
逐通道卷积计算得到C个二维矩阵后，将这些矩阵进行逐元素求和，最后生成一个新的二维特征图。
换句话说，如果输入有C个通道，每个通道通过卷积会生成一个H×W的输出矩阵，所有这些输出矩阵在每个位置上相加，得到一个H×W的新特征图。
偏置与激活函数
在卷积的结果上，通常还会加上一个偏置，再通过激活函数（如 ReLU）来引入非线性。如果卷积核的输出通过 ReLU 激活函数，负值会被置为 0，增加网络的非线性表示能力。
输出新特征图
一个卷积核会生成一个新的特征图。如果有多个卷积核，就会产生多个新的特征图，输出特征图的维度变为H×W×C。

在理解K×K卷积核的作用后，我们便不难理解1×1卷积核的使用。

降维
当输入为6x6x32时，1×1卷积的形式为1x1x32，当只有一个卷积核时，输出特征图为6×6×1。此时便可以体会到1×1卷积的实质作用：降维。当1×1卷积核的个数小于输入通道时，就有降维的效果。
全连接
这里我用了别人的图 link，输入6×6×32的特征图，有一个1×1×32的卷积核，生成6×6×1的新特征图，可以把输入32通道同一位置的像素看做是32个神经元，卷积核32通道可以看做是32×1的权重矩阵，逐元素相乘求和生成新神经元的值。
增加非线性
1×1卷积核可以在保持feature map尺寸不变的前提下大幅增加非线性特性（利用卷积后接的非线性激活函数），把网络做的很deep。
跨通道信息交换
由前面的1，2点就能明白1×1卷积核，实现升维和降维的操作就是channels间信息的线性组合变化，3x3，64channels的卷积核后面添加一个1x1，28channels的卷积核，就变成了3x3，28channels的卷积核，原来的64个channels就可以理解为跨通道线性组合变成了28channels，这就是通道间的信息交互。