Inception-v3:"Rethinking the Inception Architecture for Computer Vision"

最新推荐文章于 2025-05-06 21:41:10 发布

cv_family_z

最新推荐文章于 2025-05-06 21:41:10 发布

阅读量1.5w

点赞数 3

CC 4.0 BY-SA版权

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cv_family_z/article/details/50789805

Googlenet的延伸，通过对Inception module进行卷积分解展开网络，在ILSVRC 2012上,4个模型集成及多次裁切，top-1位为17.3%，top-5为3.5%。

GoogleNet的优势：从参数数量来看，GoogleNet参数为500万个，AlexNet参数个数为GoogleNet的12倍，VGGNet参数又是AlexNet的3倍。因此在内存或计算资源受限时，GoogleNet是比较好的选择。

Inception结构的更改：简单的放大结构，会导致计算增益消失。例如直接double滤波器组的数目会导致计算和参数4倍的增加。因此，作者给出了几个放大网络需要遵守的准则。

网络设计准则
1.避免表示瓶颈，即特征图大小应缓慢下降；
2.高维表示可以用网络代替；
3.可以在低维空间集成空间关系；
4.平衡网络的宽度和深度。

大尺寸滤波器卷积分解
GoogleNet的精度增益主要来自维度降低，这可以认为是卷积分解的特例。考虑到网络临近的激活高度相关，因此集成之前可以降维。Inception模块是全卷积的，每个权值对应一个乘法运算，进行卷积分解后可以减少参数数目进行快速训练，这样就可以增加滤波器组的大小提升精度。

1.大卷积分解为小卷积
$5\times 5$ 的卷积可以使用两层 $3\times 3$ 卷积代替，如图4为原始Inception模块，图5为替换后的模块，节约的计算时间可以用来增加滤波器数目。

这里写图片描述

这里写图片描述

2.分解为非对称卷积
$3\times 3$ 的卷积使用 $3\times 1$ 卷积和 $1\times 3$ 卷积代替，如下图所示，这种结构在前几层效果不太好，但对特征图大小为12~20的中间层效果明显。
这里写图片描述

附加分类器

最低0.47元/天解锁文章

200万优质内容无限畅学

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。