即插即用篇 | YOLOv10 引入大感受野的小波卷积 | ECCV2024

64 篇文章 35 订阅 ¥299.90 ¥399.90

在这里插入图片描述
摘要:近年来,人们尝试通过增加卷积神经网络(CNN)内核的大小来模拟视觉变换器(ViTs)自注意力模块的全局感受野。然而,这种方法很快就遇到了上限,并在达到全局感受野之前就已饱和。在这项工作中,我们证明,通过利用小波变换(WT),实际上可以在避免过度参数化的情况下获得非常大的感受野。例如,对于 k × k 感受野,所提出方法中的可训练参数数量仅随着 k 的对数增长。所提出的层,命名为 WTConv,可以在现有架构中作为直接替代使用,产生有效的多频响应,并随着感受野的大小优雅地扩展。我们在 ConvNeXt 和 MobileNetV2 架构中验证了 WTConv 层在图像分类中的有效性,以及作为下游任务的骨干网络,展示了其附加属性,例如对图像损坏的鲁棒性以及对形状而非纹理的增强响应。

论文地址:https://arxiv.org/abs/2407.05848
代码地址:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

迪菲赫尔曼

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值