从4篇顶会论文看Self-training最新研究进展-CSDN博客

本文链接：https://blog.csdn.net/c9Yv2cf9I06K2A9E/article/details/114557629

本文探讨了Self-training方法在半监督学习中的应用，重点关注如何处理伪标签的噪声问题。通过分析4篇顶会论文，包括Confidence Regularized Self-Training、Uncertainty-aware Self-training、Noisy Student和CReST，文章阐述了各种策略，如正则化、不确定性评估、噪声学生模型和类别平衡，以提高模型性能。这些方法旨在减少伪标签的不准确性，提高模型对未标记数据的利用效率。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

©PaperWeekly 原创 · 作者｜张一帆

学校｜华南理工大学本科生

研究方向｜CV，Causality

本文梳理了 Self-training 的最新进展，涉及 4 篇比较有意思的论文。

What is self-training?

Self-training 是最简单的半监督方法之一，其主要思想是找到一种方法，用未标记的数据集来扩充已标记的数据集。算法流程如下：

1. 首先，利用已标记的数据来训练一个好的模型，然后使用这个模型对未标记的数据进行标记。

2. 然后，进行伪标签的生成，因为我们知道，已训练好的模型对未标记数据的所有预测都不可能都是好的，因此对于经典的 Self-training，通常是使用分数阈值（confidence score）过滤部分预测，以选择出未标记数据的预测标签的一个子集。

3. 其次，将生成的伪标签与原始的标记数据相结合，并在合并后数据上进行联合训练。

4. 整个过程可以重复 n 次，直到达到收敛。

Self-training 最大的问题在就在于伪标签非常的 noisy，会使得模型朝着错误的方向发展。以下文章大多数都是为了解决这个问题。

ICCV 2019

论文标题：

Confidence Regularized Self-Training

论文链接：

https://arxiv.org/abs/1908.09822

代码链接：

https://github.com/yzou2/CRST

这篇文章通过对模型进行正则化，迫使输出的 vector 不那么 sharp（参考 label smooth 的作用），从而减轻使用软伪标签学习的伪标签不正确或模糊所带来的误导效果。

Main Contribution

该文的大致流程可见下图：

方法一：在打标签的过程中添加 label regularization (LR)，增加 pesudo label 的熵，类似于 label smooth 的作用。

方法二：在网络重新训练的过程中添加 model regularization (MR)，增加网络输出概率的熵。

作者提出了多项正则化手段，其目的在于增加 pesudo label 的熵。通过求解 KKT 条件，作者还解出了在该条件下模型的输出概率。可以看出是本质上都是熵增正则化项或者类似于熵增正则化项。

作者在后面通过实验论证为什么置信正则化平滑（Confidence regularization smooths）有效，两种正则化均能够使（被模型预测为正的正样本的 confidence/置信度，换句话说就是伪标签与真实标签相同时，伪标签对应类的概率值）略微降低，同时能够使（被模型预测为正的负样本的 confidence/置信度，换句话说就是伪标签与真实标签不同时，伪标签对应类的概率值）明显降低，实验结果可见下图：