半监督目标检测（一）

PhoenixPerch

已于 2023-03-10 09:53:18 修改

阅读量2.1k

点赞数 2

分类专栏： CV 文章标签：计算机视觉目标检测

于 2022-11-07 19:33:17 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wutongxdf/article/details/127719986

版权

CV 专栏收录该内容

12 篇文章 4 订阅

订阅专栏

目录

半监督学习（Semi-Supervised Learning）

1. Low-density Assumption：非黑即白

最具代表性的方法：Self-training

2. Smoothness Assumption：近朱者赤，近墨者黑

基础方法：Clustering

方法二：Graph-based Approach

A Simple Semi-Supervised Learning Framework for Object Detection

STAC 两个阶段

STAC 主要贡献

Rethinking Pseudo Labels for Semi-Supervised Object Detection

1. Certainty-aware Pseudo Labels

2. Dynamic Thresholding and Re-weighting

半监督学习（Semi-Supervised Learning）

课程：台大李宏毅老师

1. Low-density Assumption：非黑即白

假设：在两个类交界处的 density 是低的，即数据量很少。

最具代表性的方法：Self-training

【注】这种方式的 self-training 对 regression 任务没有任何效果。

2. Smoothness Assumption：近朱者赤，近墨者黑

基础方法：Clustering

方法二：Graph-based Approach

A Simple Semi-Supervised Learning Framework for Object Detection

STAC 借鉴图像分类领域使用的 semi-supervised learning（SSL）方法，主要使用了 self-training（伪标签）和 consistency regularization（数据增广）两种手段。

STAC 两个阶段

1. 在有标签数据上训练教师模型（Faster R-CNN），直至收敛。之后用训练好的教师模型在无标签数据上生成类别标签和预测框，最后利用高置信度阈值筛选伪标签；

2. 对无标签数据进行强增广，将筛选过伪标签后的无标签数据加入到训练数据中，与有标签数据一起训练模型。STAC 强增广主要包括全局色彩变换、全局或 box-level 几何变换以及 Cutout。

【注】

1. STAC 使用经 NMS 后的 bounding box 预测概率，移除了大量重复检测，之后应用 confidence-based thresholding 来进一步减少潜在的错误标签框。

2. STAC 的 data augmentation 是分步进行的：

STAC 主要贡献

1. 将图像分类领域基于 self-training 和 augmentation-driven consistency regularization 的 SSL 方法扩展到目标检测领域；

2. STAC 只引入两个新的超参数：置信度阈值 $gif.latex?%5Ctau$ （用以筛选伪标签）和非监督损失权重 $gif.latex?%5Clambda%20_%7Bu%7D$ ；

3. 针对使用 MS-COCO 的 SSL 目标检测任务，提出了新的 experimental protocols。

Rethinking Pseudo Labels for Semi-Supervised Object Detection

动机

1. 筛选检测框伪标签利用的是分类（classification）的置信度，无法反映出定位（localization）的精度；

2. 目标检测中存在较为严重的类别不均衡的问题，而一般教师模型得出的伪标签会加剧这一问题。

要点

1. Certainty-aware Pseudo Labels

为解决上述第一个问题，作者以分类的视角做 bounding box 的定位任务，从而可以测量 bounding box 的定位质量。

具体来说，作者通过分类的方法，将候选框的各边定位、分配给 ground truth 的各边。以左侧边为例，首先，作者将与左侧边垂直的一条线段均匀地分为K个间隔，通过一个 K-way 分类器，预测候选框的左侧边应该属于第几个间隔。如果 GT box 的左侧边与第 k 个间隔垂直相交，那么就标记该边的 target 为第 k 个间隔。

得到的坐标分类置信度均值 $gif.latex?v%5E%7Bi%7D$ 与原本的检测分类置信度 $gif.latex?p%5E%7Bi%7D$ 相乘，这样指标既可以反映出检测器分类的准确度，也可以反映出坐标框回归的定位精度，可以用于后续的 NMS 及生成伪标签。

另外，为了增加定位精度，作者额外训练了一个回归损失对定位坐标做更精细的修正。

2. Dynamic Thresholding and Re-weighting

针对上述第二个问题，依据前面得出的指标，作者动态调整不同类别的伪标签置信度阈值，并且重新赋予不同类别以不同的权重。

这个方法可以使得前景数量少的置信度阈值 $gif.latex?%5Ctau%20_%7Bm%7D$ 更小、损失权重 $gif.latex?%5Calpha%20_%7Bm%7D$ 更大，以缓解类别不均衡的问题。

主要参考来源：半监督目标检测研究进展 - 知乎

关注

2
点赞
踩
18

收藏

觉得还不错? 一键收藏
1
评论
半监督目标检测（一）

总结一些阅读过的半监督目标检测论文：A Simple Semi-Supervised Learning Framework for Object Detection / Rethinking Pseudo Labels for Semi-Supervised Object Detection
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。