VanillaNet

VanillaNet是一种新的深度学习模型,设计为浅而直桶状,以优化推理效率。它在结构上避免了跳跃连接和复杂的模块,但其简单的结构可能导致性能限制。为了解决这个问题,作者探索了训练策略和激活函数的改进,以提升网络的非线性能力,从而在保持高效的同时提高性能。
摘要由CSDN通过智能技术生成

论文地址:https://arxiv.org/abs/2305.12972

代码地址:GitHub - huawei-noah/VanillaNet

简而浅的直桶状网络具有非常优秀的推理效率,但其训练难度较高,难以取得优异性能。自AlexNet与VGG之后,鲜少有这种"直桶"状且性能优异的网络出现,其中的代表当属RepVGG与ParNet。

上图给出了本文所提VanillaNet架构示意图。

  • 对于Stem部分,采用4×4卷积进行特征变换;
  • 对于body部分的每个stage,首先采用MaxPool进行特征下采样,然后采用一个1×1进行特征处理;
  • 对于head部分,采用两个非线性层进行分类处理。

值得注意的是,(1) 每个stage只有一个1×1卷积;(2)VanillaNet没有跳过连接。

尽管VanillaNet非常简单且足够浅,但其弱非线性能力会限制其性能。为此,作者从训练策略与激活函数两个维度来解决该问题。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值