A Simple Semi-Supervised Learning Framework for Object Detection

最新推荐文章于 2023-10-30 10:05:16 发布

alibabazhouyu

最新推荐文章于 2023-10-30 10:05:16 发布

阅读量2.2k

点赞数

分类专栏： CNN

本文链接：https://blog.csdn.net/alibabazhouyu/article/details/110931259

版权

本文提出了一种名为STAC的半监督学习框架，用于目标检测。该框架结合自训练和数据增强一致性正则化，通过在有限的标注数据上训练模型，然后使用无标签数据生成的伪标签进行进一步训练。STAC引入了简单的超参数调整，且在Faster RCNN上展示了对MS-COCO和PASCAL VOC的有效性。关键在于使用高质量的伪标签、强大的数据增强策略，如RandAugment、颜色和几何变换，以及无监督损失来提升模型性能。

摘要由CSDN通过智能技术生成

热门的半监督学习方法大部分是基于一致性自训练的。半监督的核心思想是先为无标注的数据生成人工标签，然后训练模型预测这些人工标签。预测的人工标签可以是one-hot也可以是预测分布(soft)。SSL成功的另一个支柱是数据增强的进步。数据增强提高了深度神经网络的鲁棒性。并且已经证明对于基于一致性的自训练特别有效。复杂的数据增强策略，例如RandAugment 和CTAugment ，对SSL的图像分类非常有效。用于对象检测的SSL仅有的研究大多依赖于额外的上下文，例如对象的类别相似性。本来利用从图像分类中学到的经验到目标检测中。本文结合自训练（通过伪标签）和基于强数据增强的一致性归一化来做目标检测。第一阶段：首先使用所有标注的数据来训练目标检测器直到收敛。然后，检测器用于预测无标签的图像得到需要的标签，这些结果经过NMS和阈值处理之后得到最终精确的标签。第二阶段中：首先再无标签的图像上做强的数据增强RandAugment（本文包括全局颜色变换，全局或者边框的集合变换，cutout等），然后使用有表情的图像和无标签的图像(经过数据增强的？)以及第一阶段预测的对应的伪标签来训练模型。本文还设计了新的experimental protocols来评估实验效果。分别使用 1%, 2%, 5% and 10%的训练集作为全标签数据集，剩下的为无标签数据来训练模型。使用VOC07的trainval作为标记集，使用MS-COCO的有或没有未标记数据的VOC12的trainval作为未标记集。

贡献如下：
1.我们开发了STAC，这是一种用于对象检测的半监督学习框架，可无缝扩展基于自训练和增强驱动的一致性正则化的最新SSL分类方法。
2. STAC很简单，仅引入了两个新的超参数：置信度阈值τ和无监督loss权重λu，这不需要大量额外的调整工作。
3.我们提出了使用MS-COCO进行SSL对象检测的新