1*1卷积核的作用（bottleneck的作用）

最新推荐文章于 2025-04-05 13:00:00 发布

aift

最新推荐文章于 2025-04-05 13:00:00 发布

阅读量1.5w

点赞数 15

分类专栏：深度学习（DL）

本文链接：https://blog.csdn.net/ft_sunshine/article/details/90953784

版权

深度学习（DL）专栏收录该内容

37 篇文章

订阅专栏

本文深入解析1x1卷积核在GoogLeNet中的作用，包括特征降维、增加非线性表达能力及计算量的减少。通过对比Naive Inception module与优化后的Inception module，展示bottleneck结构如何有效降低计算复杂度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

上来先说 $1 * 1$ 卷积核的作用：

特征降维，节省计算量
增加模型非线性表达能力

举例：因为bottleneck（ $1 * 1$ 卷积核）是在2014年的GoogLeNet中首先应用的，所以我们就拿GoogLeNet来举例。

在GoogLeNet（2014）之前，网络的设计思路是一直在stack（堆叠）层数，当时的假设是网络越deeper，网络的performance越好。到了2014年，GoogLeNet横空出世，GoogLeNet改变了这个假设：除了增加深度，还增加了网络的宽度。GoogLeNet的结构如下：
在这里插入图片描述

下面我们一步步来推倒出Inception module的设计，先来看初始版本的Naive Inception module。Naive Inception module就是对同一个输入，用不同大小的卷积核去卷积，然后分别把它们的结果给concatenate（注意这里要求不同卷积操作输出的feature map的大小要相同，不然没法特征拼接呀）起来。但这样有个问题：计算量太大了！
在这里插入图片描述
注：上图 $3 * 3$ 卷积的 $p a d d i n g = 1$ ， $5 * 5$ 卷积的 $p a d d i n g = 2$ （为保证不同卷积操作输出的特征图大小一样，以便于后面的特征拼接）