no.10 EfficientNet V2

最新推荐文章于 2024-05-06 20:45:15 发布

送自己一朵小红花

最新推荐文章于 2024-05-06 20:45:15 发布

阅读量151

点赞数

分类专栏：图像分类文章标签：深度学习人工智能神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44581312/article/details/129758728

版权

图像分类专栏收录该内容

10 篇文章 0 订阅

订阅专栏

EfficientNet V2是发表在2021CVPR论文《EfficientNet V2：Smaller Models and Faster Training》

这个时候的vision Transformer还没有几个人去改进，所以这边稍微逊色了一点。

这张表格给出了EfficientNet与传统（融合）的卷积网络，vision transformer的对比

作者在v1中更关注准确率，参数数量以及FLOPs，但是理论计算量小代表不了推理速度，所以在v2中作者更关注模型的训练速度。

通过原文中给出的对比我们发现，确实有很大的优势。

作者在v1中发现了几个存在的问题：

1，训练图像的尺寸很大的时候，训练速度非常的慢，不成正比

2，在网络浅层中使用Depthwise Convlutions速度会很慢

3，同等的放大每个stage是次优的

--------------------------------------------------------------------------------------------------------------------------------

1 第一个问题就直接降低训练图像的尺寸，不仅能够加快训练速度，还能增大Batch，在no.1讲过，batch越大，训练效果越好。

2 在我们实际的使用上，我们发现，虽然DW卷积理论上的计算量小，但是实际的速度没有想象的快。我觉得可能是因为并行化太多了，反而占用了太多memory。所以提出Fused--MBConv结构。

上图表明不能全部使用Fused-MBConv，使用多了也没用。可以通过表看出，Fused-MBConv是替换了浅层网络的MBConv模块。

3同等放大每个stage是次优的。。在EfficientNetV1中，每个stage的深度和宽度都是同等放大的。但每个stage对网络的训练速度以及参数数量的贡献并不相同，所以直接使用同等缩放的策略并不合理。在这篇文章中，作者采用了非均匀的缩放策略来缩放模型。

v2网络架构：

不同点：
前几层使用Fused-MBConv模块。

使用较小的ratio，比如4，6。

偏向使用3x3的模块，v1有5x5的。

移除了v1中最后一个步距为1的stage8。

Fused-MBConv模块：

要注意：stride=1，输入与输出矩阵channel相同；当我们用捷径分支的时候才有Dropout；Dropout层不是我们使用的随机失活元素，这里的是随机失活stage的主分支。

注意：这里的dropout层仅指Fused-MBConv模块以及MBConv模块中的dropout层，不包括最后全连接层前的dropout层。

progressive Learning 渐进式学习策略。

证明渐进学习策略是有效的，作者讲渐进学习策略应用到resnet和v1中，得到的结果是positive。

送自己一朵小红花

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
no.10 EfficientNet V2

2 在我们实际的使用上，我们发现，虽然DW卷积理论上的计算量小，但是实际的速度没有想象的快。注意：这里的dropout层仅指Fused-MBConv模块以及MBConv模块中的dropout层，不包括最后全连接层前的dropout层。1 第一个问题就直接降低训练图像的尺寸，不仅能够加快训练速度，还能增大Batch，在no.1讲过，batch越大，训练效果越好。作者在v1中更关注准确率，参数数量以及FLOPs，但是理论计算量小代表不了推理速度，所以在v2中作者更关注模型的训练速度。
复制链接

扫一扫

专栏目录

送自己一朵小红花 CSDN认证博客专家 CSDN认证企业博客

码龄5年

29: 原创

127万+: 周排名

9万+: 总排名

7241: 访问

: 等级

415: 积分

82: 粉丝

115: 获赞

3: 评论

97: 收藏

私信

关注

热门文章

分类专栏

目标检测 1篇
图像分类 10篇

最新评论

第二次作业，换源export
CSDN-Ada助手: 恭喜您完成了第19篇博客！标题中的“换源export”让我对内容产生了浓厚的兴趣。您的持续创作值得赞扬，这不仅展示了您的坚持和努力，也让读者们从中获益良多。在下一步的创作中，或许您可以考虑更深入地探讨“换源export”的相关主题，比如具体介绍一些常用的数据源，并分享您在使用过程中的经验和技巧。此外，您也可以结合实际案例，展示如何有效地运用“换源export”来解决问题或优化业务。这样的创作方式将更加引人入胜，并能够帮助读者们更好地理解和应用这一概念。再次恭喜您，并期待您未来更多的精彩博文！继续保持创作的热情和努力，您一定会取得更大的成功。
第二次课程笔记
CSDN-Ada助手: 恭喜您撰写了第20篇博客！标题中的“第二次课程笔记”让我感到您在学习过程中取得了长足的进步。您的坚持和努力令人钦佩，也让读者受益匪浅。接下来，我想建议您在下一篇博客中尝试探索一些与课程内容相关的实例或案例，这将有助于更深入地理解和应用所学知识。期待阅读您未来的创作！
LLM介绍
CSDN-Ada助手: 恭喜您写下第18篇博客！标题为“LLM介绍”真是引人注目。您对LLM的介绍给读者们带来了很多有价值的信息，很高兴看到您在这一领域上的深入研究与分享。同时，我也想提供一些建议，希望能够为您的下一步创作提供一些灵感。或许您可以考虑从LLM的应用领域、与其他相关领域的交叉研究等方面进行更深入的探索，这将进一步丰富您的博客内容。感谢您的努力，期待你未来更多的精彩文章！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。