1x1卷积(Conv 1*1)的作用

R-G-B

已于 2023-07-12 21:31:59 修改

阅读量3.4k

点赞数 3

分类专栏：深度学习传统/深度三维重建MVS系列文章标签：深度学习神经网络 1x1卷积 conv 1x1

于 2022-11-07 13:36:54 首次发布

原文链接：https://blog.csdn.net/weixin_41936775/article/details/120083958

版权

传统/深度三维重建MVS系列同时被 2 个专栏收录

109 篇文章 ¥39.90 ¥99.00

订阅专栏

超级会员免费看

深度学习

51 篇文章

订阅专栏

本文介绍了1x1卷积在深度学习中的应用，主要作用包括：1.引入非线性特性，增加网络深度学习复杂函数的能力；2.通过调整通道数实现网络的维度提升或降低，减少计算量；3.促进通道间的跨通道信息交互与整合，提取更丰富特征。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一文读懂卷积神经网络中的1x1卷积核
 1x1卷积(Conv 1*1)的作用

一、来源
二、作用

Conv 1×1 一般只改变输出通道数，而不改变输出的宽度和高度；
而Pooling 操作一般只改变输出的宽和高，而不改变通道数。

一、来源

Conv 1 × 1 是 Network in Network 的简称。

对于单通道图像，其作用仅是进行线性运算；
在这里插入图片描述
对于多通道图像，Conv 1×1 会遍历图像的所有位置，将每个位置处所有通道的值作为其输入，与1×1 卷积核中对应通道的值进行线性运算。本质上可以视为一个全连接神经网络。
输出通道数为卷积核的个数。
如下图，2232与2个1132卷积，得到222
在这里插入图片描述

二、作用

1. 添加非线性特性

即保持特征图尺寸不发生变化且维持上一层的通道数，在增加网络的深度的同时令网络能够学习更为复杂的函数(特征信息)。
在这里插入图片描述
filters是滤波器（卷积核）的个数

2. 对通道数实现升维/降维

设卷积核大小为 5 × 5 × 192 ，以降维减少计算量为例。

未使用 Conv 1×1 的情况下，
在这里插入图片描述
输出大小为 28 × 28 × 32 ，其中每个值均需要经过 5 × 5 × 192 次乘法，忽略加法的情况下，该层计算量为:
28 × 28 × 32 × 5 × 5 × 192 ≈ 120 m

使用 Conv 1×1 构建瓶颈层(bottleneck)的情况下，

在这里插入图片描述
Conv 1×1 层：28 × 28 × 16 × 192 ≈ 2.4 m ；
Conv 1×1 层：28 × 28 × 32 × 5 × 5 × 16 ≈ 10.0 m 。

总参数量为 12.4 m。与上一种方式相比，在保证输入和输出的维度相同的情况下，参数量大幅减少。

这就是Conv 1×1 的降维作用。

Conv 1×1 一般只改变输出通道数，而不改变输出的宽度和高度；
而Pooling 操作一般只改变输出的宽和高，而不改变通道数。

3. 实现跨通道的信息交互与整合

Conv 1×1 所实现的通道数增加/减少，本质上其实是通道之间信息的线性组合，这些组合能够使得网络提取更加丰富的高级特征，如上一部分中 28×28×192 的输入经过1×1×192×16 的卷积操作后输出为28×28×16，即该层输入中的原192 个特征经过跨通道线性组合变成了输出中的 16 个特征。这就是通道间的信息交互。

一文读懂卷积神经网络中的1x1卷积核