GoogLeNet:inception V1、V2、V3、V4、Inception-ResNet V1、V2详解

最新推荐文章于 2023-11-21 16:11:09 发布

人工智障之深度瞎学

最新推荐文章于 2023-11-21 16:11:09 发布

阅读量955

点赞数 1

分类专栏：深度学习文章标签：深度学习 inception

本文链接：https://blog.csdn.net/weixin_44474718/article/details/99081062

版权

17 篇文章 10 订阅

订阅专栏

?（1409.CVPR） inception V1：Going Deeper with Convolutions【论文原文】

在这里插入图片描述

上图所示：GoogLeNet有 9 个线性堆叠的 Inception 模块。它有 22 层（包括池化层的话是 27 层）。该模型在最后一个 inception 模块处使用全局平均池化。

不用多说，这是一个深层分类器。和所有深层网络一样，它也会遇到梯度消失问题。

为了阻止该网络中间部分梯度的「消失」过程，作者引入了两个辅助分类器（上图紫色框）。它们对其中两个 Inception 模块的输出执行 softmax 操作，然后在同样的标签上计算辅助损失。总损失即辅助损失和真实损失的加权和。该论文中对每个辅助损失使用的权重值是 0.3。（只在训练过程中用）

表征性瓶颈：直观上来说，当卷积不会大幅度改变输入维度时，神经网络可能会执行地更好。过多地减少维度可能会造成信息的损失。

在这里插入图片描述

作者注意到辅助分类器直到训练过程快结束时才有较多贡献，那时准确率接近饱和。作者认为辅助分类器的功能是正则化，尤其是它们具备BatchNorm 或 Dropout 操作时。
是否能够改进 Inception v2 而无需大幅更改模块仍需要调查。

Inception V4和Inception-ResNet总体框架：

解决方案：

Inception v4 的 stem 被修改了。这里的 stem 参考了在引入 Inception 块之前执行的初始运算集。

上图：图左部是 Inception-ResNet v1 的 stem。图右部是 Inception v4 和 Inception-ResNet v2 的 stem
它们有三个主要的 Inception 模块，称为 A、B 和 C（和 Inception v2 不同，这些模块确实被命名为 A、B 和 C）。它们看起来和 Inception v2（或 v3）变体非常相似。

上图：（左起）在 Inception v4 中使用的 Inception 模块 A、B、C
Inception v4 引入了专用的「缩减块」（reduction block），它被用于改变网格的宽度和高度。早期的版本并没有明确使用缩减块，但也实现了其功能。

上图：缩减块 A（从 35x35 到 17x17 的尺寸缩减）和缩减块 B（从 17x17 到 8x8 的尺寸缩减）。这里参考了论文中的相同超参数设置（V,I,k）

受 ResNet 的优越性能启发，研究者提出了一种混合 inception 模块。Inception ResNet 有两个子版本：v1 和 v2。在我们分析其显著特征之前，先看看这两个子版本之间的微小差异。

为了使残差加运算可行，卷积之后的输入和输出必须有相同的维度。因此，在初始卷积之后使用 1x1 卷积来匹配深度（深度在卷积之后会增加）。

上图：（左起）Inception ResNet 中的 Inception 模块 A、B、C。注意池化层被残差连接所替代，并在残差加运算之前有额外的 1x1 卷积。
主要 inception 模块的池化运算由残差连接替代。然而，仍然可以在缩减块中找到这些运算。缩减块 A 和 Inception v4 中的缩减块相同。

上图：左起）缩减块 A（从 35x35 到 17x17 的尺寸缩减）和缩减块 B（从 17x17 到 8x8 的尺寸缩减）。这里参考了论文中的相同超参数设置（V,I,K）
如果卷积核的数量超过 1000，则网络架构更深层的残差单元将导致网络崩溃。因此，为了增加稳定性，作者通过 0.1 到 0.3 的比例缩放残差激活值。（激活值通过一个常数进行比例缩放，以防止网络崩溃。）
原始论文并没有在求和之后使用批归一化，以在单个 GPU 上训练模型（在单个 GPU 上拟合整个模型）。
研究发现 Inception-ResNet 模型可以在更少的 epoch 内达到更高的准确率。