【CVPR 2022】目标检测SOTA：DINO: DETR with Improved DeNoising Anchor Boxes for End-to-End Object Detection

最新推荐文章于 2024-07-03 22:21:13 发布

BIT可达鸭

最新推荐文章于 2024-07-03 22:21:13 发布

阅读量1.6k

点赞数

分类专栏： ▶ 深度学习-计算机视觉文章标签：目标检测深度学习机器学习计算机视觉人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44936889/article/details/125546162

版权

▶ 深度学习-计算机视觉专栏收录该内容

155 篇文章 1444 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

DINO是基于DETR的改进模型，通过对比去噪训练、混合查询选择和两次展望方法，解决了DETR训练慢和查询意义不明确的问题。在COCO数据集上，DINO达到了SOTA水平，展现了出色的可伸缩性和性能，尤其是在小物体检测上表现出色。

摘要由CSDN通过智能技术生成

DINO: DETR with Improved DeNoising Anchor Boxes for End-to-End Object Detection

摘要：
论文简介：
具体实现：
实验结果：

这篇文章是该团队的第三篇（前两篇分别是 DAB-DETR [ICLR 2022] 和 DN-DETR [CVPR 2022]，实现了 DETR 模型在 COCO 上首次达到 SOTA

摘要：

本文提出了DINO（DETR with Improved deNoising anchOr boxes）使用 ResNet50 作为主干网络能够在 COCO 训练 12 轮能达到 48.3 mAP，36 轮能达到 51.0 mAP。与排行榜上的其他模型相比，DINO显著减少了模型大小和训练前的数据大小，同时取得了更好的结果。

论文简介：

与传统检测器相比，DETR 是一种新的基于 Transformer 的检测算法，它利用可学习的查询来探测对象的存在，将目标检测作为一个集合预测任务，并通过二分图匹配来分配标签。

尽管DETR的性能很好，但其训练收敛速度很慢，而且查询的意义也不清楚。为了解决这一问题，其他人已经提出了许多方法，如最近的 DAB-DETR 提出将 DETR 查询表示为动态锚框，DN-DETR 通过引入去噪技术进一步解决了二部匹配的不稳定性问题。

但是目前最好的检测模型还是基于改进的经典探测器，如 DyHead 和 HTC。造成这一现象的两个主要原因是：

以往的类似 D

了解本专栏

超级会员免费看

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
【CVPR 2022】目标检测SOTA：DINO: DETR with Improved DeNoising Anchor Boxes for End-to-End Object Detection

本文提出了DINO（DETR with Improved deNoising anchOr boxes）使用 ResNet50 作为主干网络能够在 COCO 训练 12 轮能达到 48.3 mAP，36 轮能达到 51.0 mAP。与排行榜上的其他模型相比，DINO显著减少了模型大小和训练前的数据大小，同时取得了更好的结果。...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

BIT可达鸭 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。