谷歌最新无监督数据增强研究,全面超越现有半监督学习方法

Google AI的最新研究提出无监督数据增强(UDA)方法,革新半监督学习,即使使用少量标记样本也能达到大量标记样本的精度。UDA在NLP和计算机视觉任务中展现出卓越性能,超越现有半监督学习方法,实现与监督学习相当甚至超越的准确率。此方法通过一致性训练,使模型能从标记数据和未标记数据中学习,传播标签信息。UDA已在多个基准测试中取得最佳结果,开源代码已发布在GitHub。
摘要由CSDN通过智能技术生成

Google AI最新研究用无监督数据增强推进半监督学习,取得令人瞩目的成果。该方法超越了所有现有的半监督学习方法,并实现了仅使用极少量标记样本即可达到使用大量标记样本训练集的精度。

深度学习之所以能够成功的关键因素,是算法的进步,以及并行处理硬件(GPU / TPU)以及大型标记数据集(如ImageNet)。

然而,当标记数据稀缺时,深度学习就像缺了一条腿。在这种情况下,需要应用数据增强方法,例如对句子进行释义或将图像进行旋转,以有效地增加标记的训练数据的量。

如今,在诸如自然语言处理(NLP),视觉和语音等各种领域的数据增强方法的设计上,已经取得了重大进展。不幸的是,数据增加通常仅限于监督学习,需要标签从原始示例转移到增强示例。

 

上图:基于文本(顶部)或基于图像(底部)训练数据的示例增强操作。

在谷歌最近“用于一致性训练的无监督数据增强(UDA)”的研究中,证明还可以对未标记数据执行数据增强,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值