半监督目标检测(一)

目录

半监督学习(Semi-Supervised Learning)

1. Low-density Assumption:非黑即白

最具代表性的方法:Self-training

2. Smoothness Assumption:近朱者赤,近墨者黑

基础方法:Clustering

方法二:Graph-based Approach

A Simple Semi-Supervised Learning Framework for Object Detection

STAC 两个阶段

STAC 主要贡献

Rethinking Pseudo Labels for Semi-Supervised Object Detection

动机

要点

1. Certainty-aware Pseudo Labels

2. Dynamic Thresholding and Re-weighting


半监督学习(Semi-Supervised Learning)

课程:台大李宏毅老师

1. Low-density Assumption:非黑即白

假设:在两个类交界处的 density 是低的,即数据量很少。

最具代表性的方法:Self-training

b6e3c61fb6f3467bb136542d23cfb67f.png

【注】这种方式的 self-training 对 regression 任务没有任何效果。

 288a92219b3e40609f678236649ba8ca.png

2. Smoothness Assumption:近朱者赤,近墨者黑

57ae18b165414586863c4034ddcbe8ff.png

ec0e3ad7187e4867b6b003d77bc7d6f8.png

基础方法:Clustering

cea6b4a4c34e4960a6abd4976fe73e1f.png

方法二:Graph-based Approach

883924d4f3cf4a2f8eb73fc14ed0b1dd.png

A Simple Semi-Supervised Learning Framework for Object Detection

STAC 借鉴图像分类领域使用的 semi-supervised learning(SSL)方法,主要使用了 self-training(伪标签)和 consistency regularization(数据增广)两种手段。

cb622170a5ad446a8b6a1d40adbe4932.png

STAC 两个阶段

1. 在有标签数据上训练教师模型(Faster R-CNN),直至收敛。之后用训练好的教师模型在无标签数据上生成类别标签和预测框,最后利用高置信度阈值筛选伪标签;

2. 对无标签数据进行强增广,将筛选过伪标签后的无标签数据加入到训练数据中,与有标签数据一起训练模型。STAC 强增广主要包括全局色彩变换、全局或 box-level 几何变换以及 Cutout。

2a7d06f23261456894d52c1e6ad743e7.png

【注】

1. STAC 使用经 NMS 后的 bounding box 预测概率,移除了大量重复检测,之后应用 confidence-based thresholding 来进一步减少潜在的错误标签框。

2. STAC 的 data augmentation 是分步进行的:

7174d711f90d40c4b7ff9dc0974f2f91.png

STAC 主要贡献

1. 将图像分类领域基于 self-training 和 augmentation-driven consistency regularization 的 SSL 方法扩展到目标检测领域;

2. STAC 只引入两个新的超参数:置信度阈值 gif.latex?%5Ctau (用以筛选伪标签)和非监督损失权重 gif.latex?%5Clambda%20_%7Bu%7D

3. 针对使用 MS-COCO 的 SSL 目标检测任务,提出了新的 experimental protocols。

Rethinking Pseudo Labels for Semi-Supervised Object Detection

动机

1. 筛选检测框伪标签利用的是分类(classification)的置信度,无法反映出定位(localization)的精度;

2. 目标检测中存在较为严重的类别不均衡的问题,而一般教师模型得出的伪标签会加剧这一问题。

要点

c7c7f007883649469ab4c3f986b3c0b2.png

1. Certainty-aware Pseudo Labels

为解决上述第一个问题,作者以分类的视角做 bounding box 的定位任务,从而可以测量 bounding box 的定位质量。

具体来说,作者通过分类的方法,将候选框的各边定位、分配给 ground truth 的各边。以左侧边为例,首先,作者将与左侧边垂直的一条线段均匀地分为K个间隔,通过一个 K-way 分类器,预测候选框的左侧边应该属于第几个间隔。如果 GT box 的左侧边与第 k 个间隔垂直相交,那么就标记该边的 target 为第 k 个间隔。

cc29b13838cc48b4a0b20ca5de847883.png

 5a16bbc96e0d41adb94ed97392525fc6.png

得到的坐标分类置信度均值 gif.latex?v%5E%7Bi%7D 与原本的检测分类置信度 gif.latex?p%5E%7Bi%7D 相乘,这样指标既可以反映出检测器分类的准确度,也可以反映出坐标框回归的定位精度,可以用于后续的 NMS 及生成伪标签。

另外,为了增加定位精度,作者额外训练了一个回归损失对定位坐标做更精细的修正。

f9838518877f4d5687f4377db5cfd45a.png

2. Dynamic Thresholding and Re-weighting

针对上述第二个问题,依据前面得出的指标,作者动态调整不同类别的伪标签置信度阈值,并且重新赋予不同类别以不同的权重。

a778ae91be824dcba470db50655fcc44.png

这个方法可以使得前景数量少的置信度阈值 gif.latex?%5Ctau%20_%7Bm%7D 更小、损失权重 gif.latex?%5Calpha%20_%7Bm%7D 更大,以缓解类别不均衡的问题。

主要参考来源:半监督目标检测研究进展 - 知乎

  • 2
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
半监督目标检测是指在目标检测任务中,利用有标注和无标注的数据进行模型训练的一种方法。以下是半监督目标检测的发展历程: 1. 传统目标检测方法:早期的目标检测方法主要基于传统的机器学习算法,如SVM、HOG等。这些方法需要大量标注数据进行训练,且对于不同类别的目标需要手动设计特征。 2. 弱监督目标检测:为了减少标注数据的需求,研究者开始探索弱监督目标检测方法。这些方法利用只有图像级别标签的数据进行训练,如图像级别标签表示图像中是否包含目标。但是由于缺乏目标位置信息,这些方法的性能较低。 3. 半监督目标检测:随着深度学习的兴起,研究者开始将其应用于半监督目标检测任务中。半监督目标检测方法利用有标注和无标注的数据进行训练,通过在有标注数据上进行监督学习,同时在无标注数据上进行自监督学习或者生成伪标签,从而提高模型性能。 4. 自监督学习:自监督学习是半监督目标检测中常用的方法之一。它通过在无标注数据上设计任务,如图像重建、图像旋转等,从而生成伪标签进行训练。自监督学习可以有效利用大量无标注数据,提高模型性能。 5. 生成模型:生成模型也是半监督目标检测中的一种重要方法。生成模型通过学习数据的分布,生成新的样本,并利用这些生成的样本进行训练。生成模型可以扩充有标注数据,提高模型的泛化能力。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值