ECCV 2022 | 旷视提出半监督目标检测模型Dense Teacher,取得SOTA性能

796e66abf1458a832ca045b48b6e8d66.gif

©作者 | 热灯lamp

这篇论文提出了一个新的半监督目标检测模型 Dense Teacher,推翻了当前流行的用 thresholding 生成 hard pseudo label 的范式,Teacher 模型仅提供 dense pseudo label,能够有效地提升单阶段目标检测器 FCOS 在半监督场景下的性能。COCO 10% labeled 情况下能达到 35.11 的 mAP,是当前半监督目标检测最好的效果。

35094ef20fa613ffad1eeb650f0c4f94.jpeg

论文标题:

Dense Teacher: Dense Pseudo-Labels for Semi-supervised Object Detection

收录会议:

ECCV 2022

论文链接:

https://arxiv.org/abs/2207.02541

b3fcbab138caa666b5ee5a2fbc4fa2be.png


动机

15e950046825da2102563d4c646266b9.png

首先为什么当前的 Thresholding 生成 pseudo label 的方法不好?如上图所示,当前流行的 thresholding 生成 pseudo label 主要包含了三个步骤:

  1. NMS:用一个 threshold 去除冗余的预测框;

  2. thresholding:用一个预定义的超参数 threshold 去过滤预测出来的框;

  3. label assign.

67123e1f187b124ea59e4419683cd784.png

这三个地方都有对应的问题,前两个主要是对应的 threshold 很难选,如上图所示,(a)(b)分别展示了 score threshold 和 NMS threshold 对模型性能的影响,可以看到模型的效果随着 threshold 的波动而剧烈波动。

除此之外,这个最优的 threshold 在没有真正 label 的情况下几乎确定不了,大了不好,acc 上去了,但是 recall 很低,就会产生很多假阴性样本(False Negative);小了也不好,recall 上去了,acc 低了,就会产生很多假阳性( False Positive)样本。

而且不同的检测器用不同的 label assignment 方法, 有噪声的 pseudo label 会严重影响 label assignment。之前 label assignment 也是单阶段目标检测器的一个研究方向,诞生了很多工作,比如 ATSS,PAA。

ee937ce63d5f64e1dbba500da44d0518.png


方法

基于上面提到的一些 thresholding 产生的问题,所以作者提出了 Dense Teacher,摒弃传统的 thresholding 策略。具体的的方法很简单,teacher 对整个 feature map 经过 sigmoid 生成一个 dense label(这里有些迷惑,但作者也没有给更多具体实现细节还有些缺失,等放了代码再看),有了生成的 dense label,就可以用 Quality Focal Loss(Generalized Focal Loss)来监督 student 模型的输出了。

由于生成的 dense label 中间包含了很多 low score 的区域,作者提出用 FRS score 作为依据来过滤掉一些 low score 的区域。FRS score 定义如下:

6c311c093d30b8c7f790e6b674064a73.png

其实就是某一个样本(point in FCOS)的分类最大概率值。然后 teacher 生成的 dense label 根据 FRS score 选取 top k% 来监督 student,其余不做约束。

3e66cb5b0112ef83ca2a1af1e80aad11.png


结果

整个方法很简单,但是结果很有效。以 COCO-standard 结果为例(见下表), Dense Teacher 在各种情况下都达到了最佳的效果。

7b4e51b84e192505e6d920bd0712a4a4.png

除此之外,也对 dense label 的一些作用给出了一些解释,主要是说 dense label 能够找到一些 hard negative region 来辅助训练,如下图所示,dense label 与 box label 相比,会找到一些 hard negative region 来帮助模型训练(但是我感觉这个解释有点 weak)。

bc4512a06d01ec8a0bb8e5e4ea2d392c.png

1b781d9aa4b7d11ab198d2ef75fe507f.png

总结

Dense Teacher 提出生成 dense pseudo label 来训练 student 模型,摒弃之前的 thresholding 方法,效果提升很明显。其实半监督目标检测里面的 thresholding 一直就有问题,所以设计了很多方法来选,但是检测和分类有很大的不同,检测是一个 box level 的 thresholding,合适的 threshold 非常难选,这篇文章给出了一个新的思路。但是作者只是很简单的说因为生成的是 dense label,所以选 dense object detector,也就是 FCOS 这类 anchor free 的方法。对于 two stage 的检测器,如 Faster RCNN 来说可能就不太适用。

BTW,CVPR 2022 有一篇 Unbiased Teacher V2,里面也使用了 FCOS 检测器,也复现了 Unbiased Teacher 的结果,但是二者结果相差还是很大的。举个栗子,COCO standard 10% 数据集下,unbiased teacher v2 复现的 FCOS unbiased teacher 只有 28.18,而 Dense Teacher 复现的有 unbiased teacher 能达到 31.52 mAP(cls),33.13 (cls + reg), 这个结果和 unbiased teacher v2 的结果(32.61)差不多了。

更多阅读

855bfeee47097c0ce0f4578897e0732a.png

0b63f75928371647d80d08efaa02f177.png

5839f32bb3699e57cb29c65e398ab1cb.png

7792d6b01419bf1e41ae02d8195f8080.gif

#投 稿 通 道#

 让你的文字被更多人看到 

如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。

总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 

PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析科研心得竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。

📝 稿件基本要求:

• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注 

• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题

• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算

📬 投稿通道:

• 投稿邮箱:hr@paperweekly.site 

• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿

2fa27d24c18c2479c2684f6b41e3812b.png

△长按添加PaperWeekly小编

🔍

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

·

35f74f275e047a2ba00245802c03afff.jpeg

  • 0
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值