Unsupervised Data Augmentation For Consistency Training 论文阅读

Unsupervised Data Augmentation For Consistency Training 论文阅读

UDA这篇文章针对的是半监督学习中无标签数据的增强,论文提出,使用有标签数据的data agumentation方法,也能有效的应用于无标签数据的增强中。论文在文本分类和图像分类问题上进行了实验对比。

这是半监督训练的流程图,左侧是有标签数据,右侧是无标签数据。可以看出有标签数据的做法和普通做法没什么区别,而无标签数据采用的一种叫一致性训练的思想(不是这篇论文的成果):首先对无标签数据做一个增强,然后将增强前的数据和增强后的数据都送进网络,出一个预测结果,将这两个结果算一个KL散度作为无监督的loss,和有监督的loss加在一起做BP。目标函数就是这个样子:

min ⁡ θ J ( θ ) = E x , y ∗ ∈ L [ − log ⁡ p θ ( y ∗ ∣ x ) ] + λ E x ∈ U E x ^ ∼ q ( x ^ ∣ x ) [ D K L ( p θ ~ ( y ∣ x ) ∥ p θ ( y ∣ x ^ ) )

  • 4
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值