检测到目标服务器启用了trace方法_【ACCV2020】左脚踩右脚,目标检测的精度就能上天?一个新的目标检测锚框匹配方法...

65bb3b25003a09be287b1a0aae819155.png

24452ebef08084e9c9715092b96004a9.png

Label assignment是近期目标检测研究的热点(FreeAnchor,ATSS,PAA等)。传统的label assignment规则,不论是对于anchor-based还是anchor-free的检测方法,都是基于人工设定的先验,如RetinaNet是根据predefined anchor box和gt box的IoU,而FCOS是根据gt box的scale加feature point与object center的距离。然鹅这些规则都对物体的content和context不敏感。如上图所示,虽然 anchors A包含了更discriminative的信息(第一行)或排除了周围物体的干扰(第二行),即anchors A实际上更适合匹配为positive samples,但是由于anchors A和anchors B都和gt box有相同的IoU,现有的匹配机制其实无法分辨这些区别。

那么如何才能使anchor的匹配规则对物体的content和context敏感呢?这篇文章提出了一种Mutual Guidance(以下简称MG)的机制。我们知道,物体检测包含了定位和分类两个子任务,而MG就是利用这两个任务间的相互指导,即根据定位任务的预测动态的匹配分类任务的标签(localize to classify),反之亦然(classify to localize)。具体来说,对于分类任务而言,positive samples是定位任务预测得相对准确的anchors,因为这些anchors必然包含了discriminative的信息才能准确地定位物体;而对于定位任务而言,positive samples则是分类相对准确的anchors,原因与上条相同。那么为什么不可以直接根据本任务的预测assign本任务的label呢?这个我已经测试过了,是不行的。我猜想是因为任何一个任务的预测都是包含噪声的,而直接根据本任务的预测定义本任务的标签会放大这种噪声导致训练效果不佳。

MG机制会导致一个有趣的现象,即定位任务的标签和分类任务的标签可能会不一致。比如一个anchor的分类预测很好但是定位预测很差,那么他的定位标签为positive而分类标签是negative,即这个anchor的label既正(定位)又负(分类)。这表面上看上去很不合理,但是却可以解决目标检测领域的另一个问题:由于在传统的anchor匹配方法中,定位任务与分类任务是各自独立的优化的,导致他们在测试时会有预测不一致的问题。(比如一个物体对应了三个适合检测的anchor,第一个anchor分类预测地很好但是定位很差,第二个anchor定位预测的很好但是分类预测很差,第三个anchor两项任务都不错但是分类分数比第一个anchor略低,由于NMS只会保留分类分数高的结果,第二和第三个anchor都会被抑制掉。)MG机制会强制每个anchor输出一致的预测结果:既然你定位很准确,那你的分类也必须准确;既然你定位是错的,那就必须分类成背景;既然你分类是正确的,那定位也得跟上;既然你分类成背景,那定位也没必要优化了(反正会被NMS抑制掉)。在MG的加持下,目标检测在高IoU thresh下的精度(如AP75)就会大大提升(主要因为网络不再输出高分类分数但是定位的不咋地的结果了)。

实验结果(具体地实验细节请参见原文):

28994689edaab3d1b7879b16037b5ee9.png

PASCAL VOC数据集

8d4a42c51d39f12571b4f0a6cf2e7424.png

MS COCO数据集

bf9a93889cb539229c65f7ae8fab73ae.png

(服务器同事在用,所以有些数据暂时测不到,可能以后会更新)

MG只是一种锚框匹配的思想,理论上可以应用于任何检测器(只要这个检测器包含定位和分类功能)。例如,将MG机制应用于ATSS也会得到相应提升:

5f27f54c0f9f9d29b923754afea72a85.png

总结: 这篇文章提出了一种根据物体检测中定位与分类任务地相互指导进行label assignment的思想,这种匹配机制对物体地content和context敏感并解决了测试阶段定位与分类任务预测不一致的问题。

Paper:

https://arxiv.org/pdf/2009.14085.pdf​arxiv.org

Code:

ZHANGHeng19931123/MutualGuide​github.com
41e461e8dae438585d75836115a95a0d.png
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值