DCNv4,高效可变形卷积

CV缝合怪

已于 2024-01-19 13:59:29 修改

阅读量3.2k

点赞数 9

文章标签：深度学习人工智能

于 2024-01-19 13:58:43 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45371200/article/details/135696222

版权

github：https://github.com/OpenGVLab/DCNv4

主要解决的问题是提升基于卷积神经网络（ConvNets）的可变形卷积运算（Deformable Convolution，DCN）在计算机视觉应用中的效率和性能。文章指出尽管Deformable Convolution v3 (DCNv3) 结合了稀疏注意力机制与卷积操作，在处理具有局部性、动态采样点以及输入依赖权重的空间特征聚合方面表现出色，但其运行速度较慢且在训练初期收敛速度不如全局注意力机制，这限制了其在视觉主干模型中的广泛应用。

创新点在于提出了Deformable Convolution v4 (DCNv4)，它对DCNv3进行了如下改进：

内存访问优化：通过深入分析现有实现发现DCNv3中大量内存访问冗余，作者针对此进行优化，大幅减少了不必要的内存访问，从而显著提升了DCNv4的运行速度。
去除softmax归一化：受到卷积层不受值域约束启发，DCNv4移除了空间聚合时的softmax归一化步骤，因为对于每个位置拥有独立采样窗口的操作来说，softmax的0到1范围限制了表达能力。这一改变增强了DCNv4的动态特性并提高了性能表现。

结果表明，DCNv4不仅在收敛速度上远超DCNv3，而且前向传播速度也提高了超过三倍，使得该操作符成为最快速的核心视觉运算符之一。将DCNv4应用于InternImage模型创建出FlashInternImage后，其速度比原版提升了50%至80%，同时保持了优越的表现力。此外，DCNv4还成功地整合到了包括ConvNeXt、ViT在内的多种现代主干网络结构中，并在图像生成任务中展现出超越基线模型的能力，显示了其作为通用视觉运算符的巨大潜力。

关注

9
点赞
踩
19

收藏

觉得还不错? 一键收藏
打赏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

CV缝合怪 CSDN认证博客专家 CSDN认证企业博客

码龄5年

23: 原创

117万+: 周排名

7万+: 总排名

2万+: 访问

: 等级

411: 积分

215: 粉丝

174: 获赞

20: 评论

275: 收藏

私信

关注

热门文章

最新评论

即插即用，图像去雨雪等
m0_71022531: 您好，这个代码在您主页里没有找到
[即插即用]特征融合pag 计算机视觉即插即用模块，
weixin_46061989: 3DPAG
[水论文]Refconv替换传统卷积，不增加计算负担，即插即用
wjy000918: 这代码怎么是repconv呀
[即插即用]特征融合pag 计算机视觉即插即用模块，
CSDN-Ada助手: 恭喜您在计算机视觉领域取得了新的突破，特征融合pag模块的即插即用功能无疑将为用户带来更加便利的体验。希望您能继续保持创作的热情和耐心，不断探索更多领域的可能性。或许下一步可以考虑研究一些与人工智能结合的应用，开拓更广阔的领域。期待您的更多精彩作品！
Shift-ConvNets:具有大核效应的小卷积核
CSDN-Ada助手: 非常恭喜您写完了第18篇博客！标题中的"Shift-ConvNets"让我非常感兴趣。您的文章似乎讨论了如何通过小卷积核实现大核效应，这是一个很有创意的想法。我很高兴看到您在持续研究和探索中取得进展。作为一个读者，我希望能了解更多关于这个主题的实验结果和详细的技术细节。也许您可以分享一些实际应用案例，或者对这种方法的性能进行更深入的评估。这些扩展内容将进一步提高读者的理解和吸引力。总之，再次祝贺您的持续创作！期待您在下一篇博客中能够继续分享有关Shift-ConvNets的进一步研究成果。谦虚地说，您的博客已经成为我学习的重要资源之一。

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

CV缝合怪 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。