密集残差模块的作用

最新推荐文章于 2024-06-21 10:14:27 发布

【变强大】

最新推荐文章于 2024-06-21 10:14:27 发布

阅读量3.3k

点赞数 3

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45234219/article/details/113850763

版权

InceptionModule是Google提出的一种深度学习网络结构，核心思想是通过11、33、55卷积和33最大池化结合，提取图像不同尺度的特征，以获取更丰富的信息表示。图b对图a进行优化，通过11卷积降维减少参数量。使用1*1卷积进一步降低计算复杂性，同时保持模型性能。该模块的设计旨在平衡特征提取与计算效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

https://blog.csdn.net/dongjinkun/article/details/109185101
https://zhuanlan.zhihu.com/p/41691301

nception Module基本组成结构有四个成分。11卷积，33卷积，55卷积，33最大池化。最后对四个成分运算结果进行通道上组合。这就是Inception Module的核心思想。通过多个卷积核提取图像不同尺度的信息，最后进行融合，可以得到图像更好的表征。

如上图所示，假设我们要提取猫脸特征，而上面两张图的猫脸占比显然不一样，那么我们就得用不同卷积核提取不同信息。信息分布比较全局性的图像采用大卷积核，信息分布比较局部性的图像采用小卷积核。

图b是对图a的改进，即在33卷积，55卷积前加11卷积，目的是为了先进行降维，相比较于原来结构减少了较多参数。而把11卷积放在3*3最大池化之后，相比较放在前面，也是为了参数量的减少。

图(a)中，将11、33、55卷积和33池化堆叠在一起，卷积池化后的feature map尺寸相同，对这结构设计的原因，我的理解是：众所周知，卷积核越大，说明感受野越大，提取的信息语义层次特征更高；卷积核越小，感受野越小，提取到的特征更为直观。将不同卷积核提取到的feature map叠加在一起，不仅有直观的特征，而且也有语义层次高的特征，这样特征信息会更加丰富。但设计Inception的初衷是为了保持高性能计算，这样5*5的卷积核的计算量显得未免也太大了，这与Inception设计的初衷相悖。于是Google团队对Inception的原始版本进行了改进，即Inception V1。

使用1*1卷积的优势：

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。