RT-DETR论文解读与代码

樱花的浪漫

已于 2024-01-08 21:28:36 修改

阅读量4.1k

点赞数 2

分类专栏：目标检测 MMLAB实战+深度学习模型剪枝与部署+顶会论文文章标签：计算机视觉人工智能算法深度学习

于 2023-06-15 17:37:57 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_52053775/article/details/131215102

版权

MMLAB实战+深度学习模型剪枝与部署+顶会论文同时被 2 个专栏收录

25 篇文章 15 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

42 篇文章 32 订阅

订阅专栏

本文详细解读了RT-DETR论文，探讨了NMS对检测速度的影响，介绍了RT-DETR的混合编码器和IoU感知查询选择策略，以提升实时检测性能。并提供了PyTorch实现的解码器和编码器代码链接，适用于YOLO系列模型的后处理优化。

摘要由CSDN通过智能技术生成

RTdetr ecoder和decoder部分pytorch复现代码链接见文末
1.初始化策略与源码有所差异，使用过程中可以根据自己的需求进行更换！
2.代码经过一条一条的debug，本身没有bug,并且是依据作者源码用pytorch实现，但是在进行数据预处理时，需要保证每张图片标签不为空，否则会报错。如果您需要处理相关情况，需要自己思考策略。源码中作者没有考虑标签为空的情况。
3.本代码没有复现分割部分内容
4.代码中，后处理输出顺序进行了调整，您可以完美嵌入YOLO的代码中，进行map的计算

1.概述

目前以大名鼎鼎的YOLO为代表的基于CNN的实时监测网络需要NMS进行后处理，导致不能很好的优化网络，并且网络不够健壮，从而导致检测器的推理速度出现延迟。研究者也分析了Anchor-based和Anchor-free的YOLO的性能，发现Anchor并不是影响实时监测的关键要素，而NMS后处理彩色。

DETR很好的解决了后处理对于模型的限制，却受限于Transformer巨大的计算量，无法发挥实时监测性。

因此，作者想要重构detr,使其具有实时性。研究者发现，虽然多尺度特征的引入有利于加速训练收敛和提高性能，但它也能显著增加输入编码器的序列的长度。因此，Transformer编

了解本专栏

超级会员免费看

樱花的浪漫

关注

2
点赞
踩
10

收藏

觉得还不错? 一键收藏
打赏
3
评论
RT-DETR论文解读与代码

目前以大名鼎鼎的YOLO为代表的基于CNN的实时监测网络需要NMS进行后处理，导致不能很好的优化网络，并且网络不够健壮，从而导致检测器的推理速度出现延迟。研究者也分析了Anchor-based和Anchor-free的YOLO的性能，发现Anchor并不是影响实时监测的关键要素，而NMS后处理彩色。DETR很好的解决了后处理对于模型的限制，却受限于Transformer巨大的计算量，无法发挥实时监测性。因此，作者想要重构detr,使其具有实时性。
复制链接

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

樱花的浪漫 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。