谷歌最新无监督数据增强研究，全面超越现有半监督学习方法

最新推荐文章于 2024-11-11 20:40:55 发布

AI女神

最新推荐文章于 2024-11-11 20:40:55 发布

阅读量1.7k

点赞数

分类专栏：深度学习文章标签：人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Python_GCS/article/details/96150981

版权

Google AI的最新研究提出无监督数据增强（UDA）方法，革新半监督学习，即使使用少量标记样本也能达到大量标记样本的精度。UDA在NLP和计算机视觉任务中展现出卓越性能，超越现有半监督学习方法，实现与监督学习相当甚至超越的准确率。此方法通过一致性训练，使模型能从标记数据和未标记数据中学习，传播标签信息。UDA已在多个基准测试中取得最佳结果，开源代码已发布在GitHub。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Google AI最新研究用无监督数据增强推进半监督学习，取得令人瞩目的成果。该方法超越了所有现有的半监督学习方法，并实现了仅使用极少量标记样本即可达到使用大量标记样本训练集的精度。

深度学习之所以能够成功的关键因素，是算法的进步，以及并行处理硬件（GPU / TPU）以及大型标记数据集（如ImageNet）。

然而，当标记数据稀缺时，深度学习就像缺了一条腿。在这种情况下，需要应用数据增强方法，例如对句子进行释义或将图像进行旋转，以有效地增加标记的训练数据的量。

如今，在诸如自然语言处理（NLP），视觉和语音等各种领域的数据增强方法的设计上，已经取得了重大进展。不幸的是，数据增加通常仅限于监督学习，需要标签从原始示例转移到增强示例。

上图：基于文本（顶部）或基于图像（底部）训练数据的示例增强操作。

在谷歌最近“用于一致性训练的无监督数据增强（UDA）”的研究中，证明还可以对未标记数据执行数据增强，

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。