[半监督学习] Pseudo-Label : The Simple and Efficient Semi-Supervised Learning Method for Deep NN

码侯烧酒

已于 2022-02-18 23:22:46 修改

阅读量1.7k

点赞数

分类专栏：论文文章标签：机器学习算法深度学习

于 2022-02-07 21:27:28 首次发布

本文链接：https://blog.csdn.net/by6671715/article/details/122802849

版权

论文专栏收录该内容

27 篇文章 15 订阅

订阅专栏

以监督的方式同时使用标记和未标记的数据进行训练. 通过最小化未标记数据的熵, 促进类之间的低密度分离.

论文地址: Pseudo-Label : The Simple and Efficient Semi-Supervised Learning Method for Deep Neural Networks
代码地址: https://github.com/iBelieveCJM/pseudo_label-pytorch
会议: ICML 2013
任务: 分类

本文介绍的 Pseudo-Label 是一个非常经典的 SSL 算法, 方法非常简单, 其核心就是 self-training. 对于未标记数据, 选择预测概率最大(或置信度最大)的标记作为样本的伪标记. 然后将带伪标签的数据视作标记数据加入训练集.

Pseudo-Label 算法

利用深度神经网络(DNN), Pseudo-Label 对无标签数据进行一个预测, 选择预测结果概率最大的结果作为该数据的标签, 这个标签便称为伪标签:
$y'_i= \begin{cases} 1, & \text{if }i=\argmax_{i'}f_{i'}(x) \\ 0, & \text{otherwise} \end{cases} \tag{1}$
考虑到标记数据和未标记数据的总数差异, 整体损失函数设计如下:
$L=\frac{1}{n}\sum_{m=1}^n\sum_{i=1}^CL(y_i^m,f_i^m)+\alpha(t)\frac{1}{n'}\sum_{m=1}^{n'}\sum_{i=1}^CL(y_i'^m,f_i'^m) \tag{2}$
上式中的第一部分是有标签数据的损失函数, 第二部分表示伪标签数据的损失函数. 其中 $n$ , $n^{'}$ 分别为有标签和无标签数据集的大小, $L$ 为交叉熵损失.

式(2)中的 $\alpha(t)$ 为权重控制, 用来衡量有标记和无标记数据的重要性. 具体计算如下:
$\alpha(t)= \begin{cases} 0, & t <T_1 \\ \frac{t-T_1}{T_2-T_1}\alpha_f, & T_1 \leq t\leq T_2 \\ \alpha(f) & T_2 \leq t \end{cases} \tag{3}$
在 $T_1$ 轮之前, 只在有标记数据上训练, 然后利用训练的模型给未标记数据打上伪标签, 再逐渐增加未标记数据的权重. $\alpha(t)$ 的正确调度对于网络性能非常重要. 如果 $\alpha(t)$ 太高, 则会对训练产生非常大的干扰. 如果 $\alpha(t)$ 太小, 则不能利用到未标记数据的好处. 另外使用退火算法来优化局部最小值.

代码地址: https://github.com/EricArazo/PseudoLabeling

码侯烧酒

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
[半监督学习] Pseudo-Label : The Simple and Efficient Semi-Supervised Learning Method for Deep NN

对于未标记数据, 选择预测概率最大(或置信度最大)的标记作为样本的伪标记. 然后将带伪标签的数据视作标记数据加入训练集.
复制链接

扫一扫

专栏目录