GoogLeNet Inception V1：Going deeper with convolutions论文笔记

最新推荐文章于 2025-04-18 20:10:15 发布

小时候贼聪明

最新推荐文章于 2025-04-18 20:10:15 发布

阅读量4.6k

点赞数 3

分类专栏： deeplearning 论文论文笔记文章标签： deep-learning 论文笔记

本文链接：https://blog.csdn.net/wspba/article/details/61921619

版权

GoogLeNet Inception V1通过引入不同尺寸的滤波器和1×1卷积降低复杂度，实现深度网络的优化。在ILSVRC2014上表现出色，其模块化设计包含1×1、3×3和5×5卷积，以及最大池化层，通过1×1卷积进行通道降维，有效减少了参数量。辅助分类器增加了模型的判别性，整体参数量仅为AlexNet的十二分之一。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

论文地址：Going deeper with convolutions

前言

在ILSVRC2014上最耀眼的除了VGG，那就非GoogLeNet莫属了，它与VGG类似的地方就是，关注于模型的深度，使模型倾向于deeper，与VGG不同的是，它的尝试更加新颖。从2014年至今，GoogLeNet经历了Inception v1到v4，以及Inception-ResNet的发展，也证明了Inception最初思想的潜力。今天我们就来看看GoogLeNet Inception V1的框架和效果。

思想

GoogLeNet的思想动机也是增加模型的规模：深度，和宽度。同样的是，更大的模型意味着更多的参数，计算资源的消耗增加，模型也更容易过拟合，因此并不能盲目的增加模型的规模。

改进

深度，必须增加。那么为了较少模型复杂度，就只能在模型的宽度上做文章。VGG的做法是将每一层的滤波器尺寸都换成 $3\times3$ 来减少模型的宽度，也证明具有很好的效果。Inception的做法就是将卷积层的完全连接变成稀疏连接，而且受到生物神经学的启发，利用多个大小不一致的滤波器，在多个尺度上来提取特征，然后再连接到一个共同的输出，这样一方面在不增加参数量的前提下增加了网络的宽度，另一方面也增加了网络对多个尺度的适应性。通过对Inception进行堆叠，构成了一个含有22个权重层的GoogLeNet。