热门的半监督学习方法大部分是基于一致性自训练的。半监督的核心思想是先为无标注的数据生成人工标签,然后训练模型预测这些人工标签。预测的人工标签可以是one-hot也可以是预测分布(soft)。SSL成功的另一个支柱是数据增强的进步。数据增强提高了深度神经网络的鲁棒性。并且已经证明对于基于一致性的自训练特别有效。复杂的数据增强策略,例如RandAugment 和CTAugment ,对SSL的图像分类非常有效。用于对象检测的SSL仅有的研究大多依赖于额外的上下文,例如对象的类别相似性。本来利用从图像分类中学到的经验到目标检测中。本文结合自训练(通过伪标签)和基于强数据增强的一致性归一化来做目标检测。第一阶段:首先使用所有标注的数据来训练目标检测器直到收敛。然后,检测器用于预测无标签的图像得到需要的标签,这些结果经过NMS和阈值处理之后得到最终精确的标签。第二阶段中:首先再无标签的图像上做强的数据增强RandAugment(本文包括全局颜色变换,全局或者边框的集合变换,cutout等),然后使用有表情的图像和无标签的图像(经过数据增强的?)以及第一阶段预测的对应的伪标签来训练模型。本文还设计了新的experimental protocols来评估实验效果。分别使用 1%, 2%, 5% and 10%的训练集作为全标签数据集,剩下的为无标签数据来训练模型。使用VOC07的trainval作为标记集,使用MS-COCO的有或没有未标记数据的VOC12的trainval作为未标记集。
贡献如下:
1.我们开发了STAC,这是一种用于对象检测的半监督学习框架,可无缝扩展基于自训练和增强驱动的一致性正则化的最新SSL分类方法。
2. STAC很简单,仅引入了两个新的超参数:置信度阈值τ和无监督loss权重λu,这不需要大量额外的调整工作。
3.我们提出了使用MS-COCO进行SSL对象检测的新