Pseudo-Label：The Simple and Efficient Semi-Supervised Learning Method for Deep Neural Networks

最新推荐文章于 2024-03-20 17:57:14 发布

山歌嘎子

最新推荐文章于 2024-03-20 17:57:14 发布

阅读量4.6k

点赞数 3

分类专栏：半监督学习深度学习

本文链接：https://blog.csdn.net/u012123197/article/details/102728768

版权

半监督学习同时被 2 个专栏收录

2 篇文章 0 订阅

订阅专栏

深度学习

1 篇文章 0 订阅

订阅专栏

这是一篇发表在 ICML 2013 的文章，作为半监督神经网络的一篇代表文章。【文章】【代码】文章中采用了pesudo-label的方法来作为无标签样本的伪标签。文章的主要想法是self-training，伪标签的确定也是通过有标记样本训练的神经网络，来对无标记的样本进行预测，选择出只选择对每个未标记的样本具有最大预测概率的类。
这个方法为什么会成功，文章中解释到：（1）低密度分离（2）熵要小，这里主要应用在无标记样本上，使无标签样本的信息熵最小。这两点其实是半监督学习中经常考虑的基本原则。
在这里插入图片描述
其中损失函数如下：

这里 $y_i^m$ 是有标签样本的真实标签， $f_i^m$ 是神经网络的输出标签，前边这项很好理解，就是监督学习下的神经网络的损失函数。而后边这项，是无标记样本的损失项。其中 $y_i^{'m}$ 是1或者0， $y_i^{'m}$ 是伪标签，而 $f_i^{'m}$ 是神经网络的输出。 $a (t)$ 是一个权重系数。 $a (t)$ 太大，就会扰乱有标签的数据；如果 $a (t)$ 太小，无对无标记样本对促进学习没有任何帮助。 $a (t)$ 的确定，就对算法好坏有着直接影响，文章中采用模拟退火算法，来确定 $a (t)$ 。文章中，的损失函数其实就是两部分的结合，在给无标签样本添加标签后，然后选择置信度高的样本扩充到有标签的样本中，在训练模型，不断的更新模型，其实质笔者认为还是self-training的模式，在给定伪标签的方式，不再像传统的聚类，或者分类算法给出，在一定程度上能解决因为标签标签噪声带来模型崩溃的问题。
在这里插入图片描述

实验结果

数据集：MNIST
pseudo-labeld达到了当时的state-of-the-art的水平。
在这里插入图片描述

山歌嘎子

关注

3
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
Pseudo-Label：The Simple and Efficient Semi-Supervised Learning Method for Deep Neural Networks

这是一篇发表在 ICML 2013 的文章，作为半监督神经网络的一篇代表文章。【文章】【代码】文章中采用了pesudo-label的方法来作为无标签样本的伪标签。文章的主要想法是self-training，伪标签的确定也是通过有标记样本训练的神经网络，来对无标记的样本进行预测，选择出只选择对每个未标记的样本具有最大预测概率的类。这个方法为什么会成功，文章中解释到：（1）低密度分离（2）熵要小，这...
复制链接

扫一扫