Inception V4

最新推荐文章于 2024-08-18 10:38:25 发布

emergency_rose

最新推荐文章于 2024-08-18 10:38:25 发布

阅读量740

点赞数

分类专栏： paper阅读笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_30618203/article/details/115403744

版权

paper阅读笔记专栏收录该内容

60 篇文章 0 订阅

订阅专栏

1、目的

受显存限制，旧版的Inception模型必须被拆分成sub-network进行训练；为了加速训练，在进行网络设计时就需要平衡不同sub-network之间的计算量，从而限制了网络设计的灵活性。

TensorFlow的出现，优化了梯度回传过程，使得显存占用量大大减少，无须将网络拆分训练。因此作者开始考虑performance更优的网络设计。

2、网络结构

1）stem （左：Inception-v4和Inception-ResNet-v2，右：Inception-ResNet-v1）

2）Inception A（35 x 35） / B（17 x 17） / C（8 x 8）模块

3）Reduction-A模块（35 -> 17）

3、Inception V4

网络表现与Inception-ResNet-v2相同

1）网络结构

2）Inception A - B - C模块

3）Reduction-B模块（17-> 8）

4、Residual Inception

1）在Inception block后添加filter-expansion层（conv 1 x 1，不用非线性激活层，用于使filter bank的输出尺寸与identity一致，从而便于addition操作）

2）不在summation操作后使用BN。大的激活层参数会显著增加内存占用，不用BN可以方便增加更多的Inception模块

3）Inception模块中不使用pooling层

4）网络结构

5）残差scaling

当channel数超过1000时，残差变量开始不稳定，训练早期网络就会“died”，经过几千个iteration之后，avg pooling前的网络输出就都变成了0。通过降低lr和增加BN层无法解决该问题;当channel数非常大时，即便用warm-up也很难训练。

残差scaling在不必要的时候，也不会影响最终的accuracy，但可以帮助训练过程更加稳定。

4.1 Inception-ResNet-v1

计算量与Inception-v3相似

1）Inception A - B - C模块

2）Reduction-B模块（17-> 8）

4.2 Inception-ResNet-v2

计算量与Inception-v4相似，但训练速度比inception-v4快

1）Inception A - B - C模块

2）Reduction-B模块（17-> 8）

5、结论

1）不使用残差结构也能训出相对较深的网络，但残差结构能极大的加速训练

2）一些证据表明，带残差结构的Inception网络略优于相似计算量下的Inception网络

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。