CVPR 2024 | Efficient Deformable ConvNets: Rethinking Dynamic and Sparse Operator

CVPR 2024 - Efficient Deformable ConvNets - Rethinking Dynamic and Sparse Operator for Vision Applications

在这里插入图片描述

本文提出了高效的 DCNv4,这是一个专为视觉应用设计的高效有效的运算符。

在这里插入图片描述

DCNv4 通过两个关键增强解决了其前身 DCNv3 的限制:

  • 在空间聚合中去除 softmax 归一化,以增强其动态特性和表达能力;
  • 优化内存访问,最小化冗余操作以加快速度。通过对现有实现进行指令级内核剖析,发现 DCNv3 已经很轻量级,计算成本不到 1%,而内存访问成本占了 99%。因此重新审视运算符实现,并发现许多内存访问在 DCN 的前向过程中是冗余的,可以通过优化来实现更快的 DCNv4 实现。

在这里插入图片描述

这些改进使得 DCNv4 与 DCNv3 相比显示出显著更快的收敛速度,并且处理速度大大提高,DCNv4 的速度提高了三倍以上。

将 DCNv4 集成到其他现代骨干架构中,包括 ConvNeXt 和 ViT,替换深度可分离卷积和密集自注意力层。值得注意的是,在没有进行任何超参数调整的情况下,这些经过精心设计的网络在使用 DCNv4 时表现得相当出色,同时速度快得多,显示了动态、稀疏的 DCNv4 的有效性和效率。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值