半监督目标检测超强SOTA:Consistent-Teacher(附论文下载)

关注并星标

从此不迷路

计算机视觉研究院

2046db7cbc6085fb573d5401d2778917.gif

a163f1b989574a6de8bdbcc4e5f7b015.gif

公众号IDComputerVisionGzq

学习群扫码在主页获取加入方式

10b8815c4d9f225cdf0f2bb4212e8703.png

论文地址:https://arxiv.org/abs/2209.01589

计算机视觉研究院专栏

作者:Edison_G

《Consistent-Teacher: Towards Reducing Inconsistent Pseudo-targets in Semi-supervised Object Detection》是一篇关于半监督目标检测的论文。该论文提出了一种新的方法,称为“Consistent-Teacher”,用于减少伪目标(pseudo-targets),这些伪目标是由于标签的不一致性而引入到训练中的错误对象。

一、总概述

在本研究中,研究者深入研究了半监督目标检测(SSOD)中伪目标的不一致性。核心观察结果是,振荡的伪目标破坏了精确的半监督检测器的训练。它不仅给学生的训练注入了噪声,而且导致了分类任务的严重过拟合。因此,研究者提出了一个系统的解决方案,称为一致教师,以减少不一致。首先,自适应锚分配(ASA)取代了基于静态IoU的策略,使学生网络能够抵抗噪声伪边界盒;然后,通过设计三维特征对齐模块(FAM-3D)来校准子任务预测。它允许每个分类特征在任意尺度和位置自适应地查询回归任务的最优特征向量。最后,高斯混合模型(GMM)动态地修正了伪框的得分阈值,从而稳定了基本事实的数量

21bf386b2ee570e232b724f4402f8ae5.png

二、动机

在这项研究中,研究者指出,半监督检测器的性能仍然在很大程度上受到伪目标不一致性的阻碍。不一致意味着伪框可能非常不准确,并且在训练的不同阶段变化很大。因此,不一致的振荡边界盒(bbox)会使SSOD预测产生累积误差。与半监督分类不同,SSOD有一个额外的步骤,即为每个RoI/锚点分配一组伪框作为密集监督。常见的两级和单级SSOD网络采用静态的锚分配标准,例如IoU分数或中心度。据观察,静态作业对教师预测的边界框中的噪声很敏感,因为假边界框中一个小的扰动可能会极大地影响作业结果。因此,它导致未标记图像上的严重过拟合。

为了验证这一现象,在MS-COCO 10%数据的基础上,用基于IoU的标准分配来训练单级探测器。如下图所示,教师输出的微小变化导致伪框边界中的强噪声,导致在基于IoU的静态分配下,错误目标与附近对象相关联。这是因为一些未激活的主播在学生网络中被错误地分配为阳性。因此,网络会过拟合,因为它会为相邻对象生成不一致的标签。在未标记图像的分类损失曲线中也观察到过拟合。

不一致是指伪框可能高度不准确,并且在不同的训练阶段差异很大。

9a573c17191741d5822bb4b0abc3e322.jpeg

Motivation: Inconsisteny For SSOD

(左)比较“Mean-Teacher ”和“Consistent-Teacher”的训练损失。在Mean-Teacher中,不一致的伪目标导致分类分支上的过拟合,而回归损失变得难以收敛。相反,新提出的方法为学生设定了一致的优化目标,有效地平衡了这两项任务并防止了过度拟合。

(右)伪标签和分配动态的快照。绿色和红色的框指的是北极熊的真值和伪值。红点是为伪标签指定的定位框。热图表示教师预测的密集置信度分数(越亮越大)。附近的木板最终在基线中被错误地归类为北极熊,而提出的自适应分配防止了过度拟合。

三、实验及结果

研究者的工作解决了SSOD的不一致问题。以下是训练过程中不同时间步长的一些样本检测结果:

Red: False Positive; Blue: True Postive; Green: Ground-truth

a0de330726a7aa6e468e2c7a3f5034ca.gif

Mean-Teacher

3ac2cdd06b5bb384c5ad0eaddd0d613d.gif

Consistent-Teacher

504dd91352bd7f014d4d674af214ce64.gif

Mean-Teacher

6c4abba8ecb39d3de0f5de6f06803bdf.gif

Consistent-Teacher

3cecbeacaf3ef12290c0fc4b6ac94c20.png

© THE END 

转载请联系本公众号获得授权

396976692d28a89248825c86445a4aad.gif

计算机视觉研究院学习群等你加入!

ABOUT

计算机视觉研究院

计算机视觉研究院主要涉及深度学习领域,主要致力于人脸检测、人脸识别,多目标检测、目标跟踪、图像分割等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!

VX:2311123606

b99abffbfa5d8276a280c1781683db25.png

往期推荐

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

计算机视觉研究院

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值