Inception v4&Inception-ResNet-V1V2论文笔记

最新推荐文章于 2024-01-15 21:21:34 发布

B1CK

最新推荐文章于 2024-01-15 21:21:34 发布

阅读量606

点赞数 1

分类专栏：论文笔记文章标签：论文阅读人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_52038588/article/details/127838541

版权

论文笔记专栏收录该内容

35 篇文章 0 订阅

订阅专栏

Inception v4&Inception-ResNet

Inception-v4, Inception-ResNet and the Impact of Residual Connections on Learning

主要工作是把inception模型加宽加深，resnet版本的加残差

文章点到不用残差连接也能训练深模型（Inception-v4）

残差连接优化:

用1*1卷积降维减少计算量

在这里插入图片描述

Inception v4

架构方面比v3模块数量更多，替换了abc模块，修改了stem

在这里插入图片描述

Inception-Resnet-v1&v2

inception-resnet-v2和inceptionv4的stem一样（上图）v1不同。V代表不适用padding，无V代表same padding，输入输出大小一样。

在这里插入图片描述

详细的每个版本的模块见下文

Inception v4模块

比v3模块数量更多，A、B模块里pooling和1* 1卷积换了位置，C模块拆了3* 3卷积为不对称卷积。

在这里插入图片描述

Inception-Resnet-v1模块

和跳跃连接相加之前1*1卷积没有激活函数，作用是升维

BN只在没有inception的地方用，因为之后多模型融合每个BN都要保存mean和var，当时的显存带不动

相比v4加了残差连接，A模块删了pooling，B模块删了pooling和一个大感受野支路，C模块删了pooling和大感受野支路。

在这里插入图片描述

Inception-Resnet-v2模块

和跳跃连接相加之前1*1卷积没有激活函数，作用是升维

BN只在没有inception的地方用，因为之后多模型融合每个BN都要保存mean和var，当时的显存带不动

1*1卷积数量比Inception-Resnet-v1高，结构都一样。

在这里插入图片描述

下采样a模块

Inception-Resnet-v1&v2，Inception-v4一样的下采样模块，和Inception-v3一样

在这里插入图片描述

在这里插入图片描述

下采样b模块

Inception-v4 only：

在这里插入图片描述

inception-resnet-v1

在这里插入图片描述

inception-resnet-v2

这里我怀疑这里不是同一个人写的，前文指明了这个就是v2的下采样b模块但图注释写的是v1？

在这里插入图片描述

stem1

inception-resnet-v2和inceptionv4的stem一样（见上文inceptionv4架构图右侧），新的stem加了并行的支路。

stem2

就是inceptionv3的stem （一模一样维度都不带变的）

在这里插入图片描述

Scaling of the Residuals

在这里插入图片描述

原因：

卷积核数量超过1000出现不稳定现象在早期训练时网络就g了，即在最后avg pooling之前，训练一小会，最后的feature map里有很多0

解决：

跳跃连接之前对残差分支的结果乘以很小的系数0.1-0.3，越深乘的数越小（缓慢变化？）

Training

复制体数量变成20，momentum0.9，其他和v3一模一样

Experiments

Top-5错误率v3和inception-resnet-v1差不多，但是inception-resnet-v1收敛更快。V4和inception-resnet-v2均比前面两个好，top5错误率也差不多，但是resnet版的收敛更快。
TOP1错误率I-R-v2比v4稍微好一点。
10/12裁剪-单模型：top1v4v2一样最好18.7%，v2top5低0.1%为4.1%，均比resnet151好
144裁剪：top1v4v2一样最好17.8%，v2top5低0.1%为3.7%，均比resnet151好，说明114更能提高模型表现
下面是模型融合的实验：

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Inception v4&Inception-ResNet-V1V2论文笔记

Inceptionv4，Inception-resnet-v1&v2主要工作是把inception模型加宽加深，resnet版本的加残差文章点到不用残差连接也能训练深模型（Inception-v4）
复制链接

扫一扫

专栏目录

B1CK CSDN认证博客专家 CSDN认证企业博客

码龄4年

52: 原创

76万+: 周排名

12万+: 总排名

4万+: 访问

: 等级

637: 积分

14: 粉丝

67: 获赞

8: 评论

110: 收藏

私信

关注

热门文章

分类专栏

论文笔记 35篇
算法 1篇
Pytorch实现 4篇
KanColle 1篇

最新评论

CLIP Surgery论文阅读
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
CLIP Surgery论文阅读
inscredion: 正好看到了这篇工作，里面的冗余特征机制有效果，BTW，这篇Paper没有中CVPR，至今貌似还是arXiv
ESM蛋白质语言模型系列
赶路人@a: esm2的都包含哪些嵌入，嵌入过程是怎么样的
Pico+UnityXR实现简单移动和交互
huolechilu: 怎么直接抓取控制按钮而不是射线呢
Inception v2&Batch Normalization论文阅读笔记
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34 给我们提。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。