【机器学习】伪标签（Pseudo-Labelling）

最新推荐文章于 2024-07-25 17:01:05 发布

无问东西听从我心

最新推荐文章于 2024-07-25 17:01:05 发布

阅读量3.6k

点赞数 1

分类专栏：深度学习项目学习文章标签：机器学习深度学习人工智能

原文链接：https://cloud.tencent.com/developer/article/1050723

版权

深度学习项目学习专栏收录该内容

6 篇文章 0 订阅

订阅专栏

监督学习
即使用标签数据(受监督的学习)和不加标签的数据(无监督的学习)。

在这里插入图片描述
在添加了不加标签的数据之后，我们的模型的决策边界变得更加准确。因此，使用不加标签数据的好处是:

1.被贴上标签的数据既昂贵又困难，而没有标签的数据则是充足而廉价的。

2.它通过更精确的决策边界来改进模型的鲁棒性。

现在，我们对半监督学习有了一个基本的了解。有多种不同的技术在应用着半监督学习，在本文中，我们将尝试理解一种称为伪标签的技术。

伪标签

第一步：使用标签数据训练模型

第二步：使用训练的模型为不加标签的数据预测标签

第三步：同时使用pseudo和标签数据集重新训练模型

在第三步中训练的最终模型用于对测试数据的最终预测。

在这里插入图片描述

采样率的依赖

为了找出样本率对伪标签性能的依赖，让我们在这两者之间画一个图。在这里，我只使用了两种算法来表示对时间约束（time constraint）的依赖，但你也可以尝试其他算法。

我们可以看到，rmse对于采样率的特定值来说是最小值，这对于算法来说是不同的。因此，对采样率进行调优是很重要的，以便在使用伪标签时获得更好的结果。

半监督学习的应用

在过去，半监督学习的应用数量有限，但目前在这一领域仍有很多工作要做。下面列出了一些我感兴趣的应用。

1.多模态半监督学习（Multimodal semi-supervised learning）图像分类

一般来说，在图像分类中，目标是对图像进行分类，无论它属于这个类别还是不属于类别。本文不仅利用图像进行建模，还利用半监督学习的方法来改进分类器，从而提高分类器的使用效果。

无问东西听从我心

关注

1
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
【机器学习】伪标签（Pseudo-Labelling）

监督学习即使用标签数据(受监督的学习)和不加标签的数据(无监督的学习)。在添加了不加标签的数据之后，我们的模型的决策边界变得更加准确。因此，使用不加标签数据的好处是:1.被贴上标签的数据既昂贵又困难，而没有标签的数据则是充足而廉价的。2.它通过更精确的决策边界来改进模型的鲁棒性。现在，我们对半监督学习有了一个基本的了解。有多种不同的技术在应用着半监督学习，在本文中，我们将尝试理解一种称为伪标签的技术。伪标签第一步：使用标签数据训练模型第二步：使用训练的模型为不加标签的数据预测标签第三步：
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。