VanillaNet

最新推荐文章于 2024-10-06 23:55:17 发布

Dream Algorithm

最新推荐文章于 2024-10-06 23:55:17 发布

阅读量122

点赞数 2

文章标签：深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/A2321161581/article/details/130857670

版权

VanillaNet是一种新的深度学习模型，设计为浅而直桶状，以优化推理效率。它在结构上避免了跳跃连接和复杂的模块，但其简单的结构可能导致性能限制。为了解决这个问题，作者探索了训练策略和激活函数的改进，以提升网络的非线性能力，从而在保持高效的同时提高性能。

摘要由CSDN通过智能技术生成

论文地址：https://arxiv.org/abs/2305.12972

代码地址：GitHub - huawei-noah/VanillaNet

简而浅的直桶状网络具有非常优秀的推理效率，但其训练难度较高，难以取得优异性能。自AlexNet与VGG之后，鲜少有这种"直桶"状且性能优异的网络出现，其中的代表当属RepVGG与ParNet。

通过引入结构重参数机制，RepVGG将"直桶状"网络重新焕发生机。但RepVGG的深度仍然有20+的深度，感兴趣的同学可以查看RepVGG|让你的ConVNet一卷到底，plain网络首次超过80%top1精度。
后来，Princeton大学的邓嘉团队提出了深度为12的网络并在ImageNet数据集上达到了80.7%，但引入的注意力导致了额外的跳过连接，仍为达到极限推理效率。对ParNet一文感兴趣的同学可查阅12层也能媲美ResNet？邓嘉团队提出最新力作ParNet，ImageNet top1精度直冲80.7%

上图给出了本文所提VanillaNet架构示意图。

对于Stem部分，采用4×4卷积进行特征变换；
对于body部分的每个stage，首先采用MaxPool进行特征下采样，然后采用一个1×1进行特征处理；
对于head部分，采用两个非线性层进行分类处理。

值得注意的是，(1) 每个stage只有一个1×1卷积;（2）VanillaNet没有跳过连接。

尽管VanillaNet非常简单且足够浅，但其弱非线性能力会限制其性能。为此，作者从训练策略与激活函数两个维度来解决该问题。

Dream Algorithm

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Dream Algorithm CSDN认证博客专家 CSDN认证企业博客

码龄3年

60: 原创

110万+: 周排名

4万+: 总排名

4万+: 访问

: 等级

837: 积分

130: 粉丝

212: 获赞

16: 评论

273: 收藏

私信

关注

热门文章

最新评论

使用grad_cam生成自己的模型的热力图
jestermockery: 请问根据什么文件夹的排序，如何图片是打乱的呢？
使用grad_cam生成自己的模型的热力图
Dream Algorithm: 目标类别就是你想让你的网络注意力到的类别，是根据文件夹的排序定义的，第一个类别文件夹的target_category为0
特征增强自蒸馏卷积神经网络
sw10124: 不亏是石老师高徒，太厉害了
使用grad_cam生成自己的模型的热力图
weixin_43912852: 请问target_category = 4这个是什么来填写的，数据集里面没有这个
使用grad_cam生成自己的模型的热力图
weixin_48008327: 这段代码报错怎么办呢？ output = output[0] # 注意：如果模型是多输出，需要选择自己想要的输出 for i in range(len(target_category)): loss = loss + output[i, target_category[i]] 报错内容：RuntimeError: grad can be implicitly created only for scalar outputs

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。