#今日论文推荐# ResNet50上天 | DDQ改进Sparse RCNN让ResNet50在coco上来到了49.8的AP

#今日论文推荐# ResNet50上天 | DDQ改进Sparse RCNN让ResNet50在coco上来到了49.8的AP

在 DETR 出现之后,端到端的目标检测得到了迅速的发展。DETR 使用一组稀疏查询来替换大多数传统检测器中的密集候选框。相比之下,稀疏查询不能保证作为密集先验的高召回率。但是,在当前框架中,使查询变得密集并非易事。它不仅计算成本高,而且优化困难。由于稀疏查询密集查询都不完美,那么端到端目标检测中的预期查询是什么?
本文表明预期的查询应该是密集的不同查询(DDQ)。具体来说,将密集先验引入框架以生成密集查询。对这些查询应用重复查询删除预处理,以便它们彼此区分开来。然后迭代处理密集的不同查询以获得最终的稀疏输出。
实验展示了 DDQ 更强大、更健壮且收敛更快。它在 MS COCO 检测数据集上仅用 12 个 epoch 就获得了 44.5 AP;在各种数据集上的目标检测和实例分割任务上都优于以前的方法。DDQ 融合了传统密集先验和最近的端到端检测器的优势。作者希望它可以将 DDQ 作为一个新的Baseline,并激发研究人员重新审视传统方法和端到端检测器之间的互补性。

目标检测是计算机视觉中最基本的挑战之一,旨在用单个边界框定位每个目标。它带来了一个具有挑战性的问题,即准确的目标检测器既要检测所有目标又要避免预测重复的框。

为了解决这个问题,以前最先进的方法大多遵循标准范式,如图 1(a)所示,首先生成密集的候选框,然后将一个 GT 分配给许多候选框以实现高目标召回;然而,一对多的分配会导致冗余预测。由于在目标检测中每个目标应该只有一个预测,因此采用辅助后处理,例如非极大值抑制(NMS)来去除重复的预测。尽管多年来一直主导目标检测,但该 Pipeline 在不损害正确预测的情况下完美过滤掉了重复框。

论文题目:What Are Expected Queries in End-to-End Object Detection?
详细解读:https://www.aminer.cn/research_report/62a158557cb68b460fcded85?download=falseicon-default.png?t=M4ADhttps://www.aminer.cn/research_report/62a158557cb68b460fcded85?download=false
AMiner链接:https://www.aminer.cn/?f=cs

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值