1x1卷积(Conv 1*1)的作用

最新推荐文章于 2025-04-11 16:28:19 发布

犬冢紬希

最新推荐文章于 2025-04-11 16:28:19 发布

阅读量1.1w

点赞数 21

分类专栏： DL相关的小问题文章标签：深度学习神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41936775/article/details/120083958

版权

DL相关的小问题专栏收录该内容

1 篇文章

订阅专栏

一、来源

$Conv\ 1\times1$ 是 Network in Network 的简称。

对于单通道图像，其作用仅是进行线性运算；
对于多通道图像， $Conv\ 1\times1$ 会遍历图像的所有位置，将每个位置处所有通道的值作为其输入，与 $1\times1$ 卷积核中对应通道的值进行线性运算。本质上可以视为一个全连接神经网络。

在2014谷歌提出的 Inception Network 与 2015年何神等提出的 Residual Network 中均应用了 $Conv\ 1\times1$ 。

二、作用

1. 添加非线性特性

即保持特征图尺寸不发生变化且维持上一层的通道数，在增加网络的深度的同时令网络能够学习更为复杂的函数(特征信息)。

2. 对通道数实现升维/降维

设卷积核大小为 $5\times5\times192$ ，以降维减少计算量为例。

未使用 $Conv\ 1\times1$ 的情况下，

输出大小为 $28\times28\times32$ ，其中每个值均需要经过 $5\times5\times192$ 次乘法，忽略加法的情况下，该层计算量为:
$28\times28\times32\times5\times5\times192\approx120m$
使用 $Conv\ 1\times1$ 构建瓶颈层(bottleneck)的情况下，

$Conv\ 1\times1$ 层： $28\times28\times16\times192\approx2.4m$ ；
$Conv\ 1\times1$ 层： $28\times28\times32\times5\times5\times16\approx10.0m$ 。

总参数量为 $12.4 m$ 。与上一种方式相比，在保证输入和输出的维度相同的情况下，参数量大幅减少。

这就是 $Conv\ 1\times1$ 的降维作用。

$Conv\ 1\times1$ 一般只改变输出通道数，而不改变输出的宽度和高度；而 $P o o l i n g$ 操作一般只改变输出的宽和高，而不改变通道数。

3. 实现跨通道的信息交互与整合

$Conv\ 1\times1$ 所实现的通道数增加/减少，本质上其实是通道之间信息的线性组合，这些组合能够使得网络提取更加丰富的高级特征，如上一部分中 $28\times28\times192$ 的输入经过 $1\times1\times192\times16$ 的卷积操作后输出为 $28\times28\times16$ ，即该层输入中的原 $192$ 个特征经过 跨通道线性组合 变成了输出中的 $16$ 个特征。这就是通道间的信息交互。

参考：一文读懂卷积神经网络中的1x1卷积核

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。