深度学习之基础模型-Inception-V3

最新推荐文章于 2024-08-18 10:38:25 发布

leo_whz

最新推荐文章于 2024-08-18 10:38:25 发布

阅读量1.3w

点赞数

分类专栏： base_model 文章标签：深度学习

本文链接：https://blog.csdn.net/whz1861/article/details/78289379

版权

本文详细介绍了深度学习模型Inception-V3的设计原则和改进，包括大卷积到小卷积的转换、辅助分类器的作用、有效降低特征图尺寸的方法以及网络结构的优化。通过这些策略，Inception-V3在保持高性能的同时，降低了计算成本和参数数量，适合资源有限的场景。此外，文中还探讨了标签平滑作为正则化的手段。

摘要由CSDN通过智能技术生成

Although increased model size and computational cost tend to translate to immediate quality gains for most tasks (as long as enough labeled data is provided for training), computational efficiency and low parameter count are still enabling factors for various use cases such as mobile vision and big-data scenarios.

从论文中，可以看出作者主要考虑的是虽然网络的深度增加给很多任务带来了很多好处，但是模型的大小和计算效率也很关键，尤其是对于一些移动设备或者大数据场景，就显得很有必要了。

作者指出，尽管VGGNet在特征提取方面具有非常简洁的优势，但是也消耗了大量的计算资源，另一方面，GoogLeNet（Inception-V1）在内存和计算复杂度方面做了限制下，也能达到很好的效果。

GoogLeNet包含5million参数，只是AlexNet的 $\frac{1}{12}$ ，其中AlexNet包含60million参数
VGGNet包含的参数比AlexNet的3倍还多

通用设计原则

避免采用带有瓶颈的层，尤其在网络结构开始的时候。对于一个前向传播网络，可以将其看作一个有向五环图（从输入到分类或者回归层）。将输入与输出进行分开，都能导致大量的信息从分开处流失。一般的情况下，特征图的大小从输入到输出应该缓慢下降。理论上讲，很多信息不能通过特征维数来得到，比如相关性结构。维度智能代表一些粗略的信息。
高维度能够很更容易在网络的局部进行处理。在卷积网络结构中，增加非线性能够使得更多的特征解耦合。从而使的网络训练速度更快。
空间聚合能够在低维嵌入进行，然而不会带来任何表达能的减弱。例如，在进行3x3的卷积时，可以在空间聚合之前，对输入进行降维，而不会带来严重的影响。原因：如果采用空间聚合，则相邻的位置的信息具有强相关性，即使进行了降维，也不会带来太多的损失，并且维数的降低，也能够加速网络学习。
平衡网络的宽度和深度。最优的网络可以通过平衡每一个阶段的滤波器的个数和网络的深度达到。网络的宽度和深度的增加可以使的网络达到了一个更高的效果。但是，最优的网络结构都是通过同时来提升网络的宽度和深度，但是也需要考虑计算资源的分配。

大卷积->小卷积

考虑1x1卷积后面紧跟3x3卷积，由于激活层的相邻位置是高度相关的，因此这种先降维后聚合的操作也可以达到类似的局部表达效果。
任何的降维都能减少网络的参数。从而，合适的卷积分解，能得到更多的解耦合的特征，这也有助于提高网络训练的速度。另一方面，也可以利用节省下来的内存去增加filter-bank的大小，使得模型能哦股在单个机器上进行训练。
3x3的卷积相对5x5的卷积能减少更多的参数。因此可以利用两个3x3的小卷积代替一个5x5的卷积核，表达能力没有减弱，但参数却减少很多( $\frac{9+9}{25}$ )[利用小卷积代替大卷积的思想在VGG中也有讨论]

网络结构

遵循上面的原则，对Inception-v进行了改进