Unsupervised Data Augmentation For Consistency Training 论文阅读

最新推荐文章于 2022-11-01 10:36:56 发布

cccler

最新推荐文章于 2022-11-01 10:36:56 发布

阅读量3.2k

点赞数 4

分类专栏： CV

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38992914/article/details/103121967

版权

本文探讨了在半监督学习中如何利用无标签数据进行增强。论文提出，适用于有标签数据的增强方法同样适用于无标签数据，并在文本分类和图像分类任务中进行了实验。通过一致性训练，论文引入了一种新的无监督损失，结合有监督损失进行反向传播。实验中，论文采用了RandAugment等方法进行图像增强，并发现适当的数据增强策略能显著提升模型性能。此外，论文还提出了Training Signal Annealing (TSA) 技术来防止有标签数据过拟合。然而，由于计算资源限制，作者无法进行全面的复现实验，但仍将代码分享在GitHub上。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Unsupervised Data Augmentation For Consistency Training 论文阅读

UDA这篇文章针对的是半监督学习中无标签数据的增强，论文提出，使用有标签数据的data agumentation方法，也能有效的应用于无标签数据的增强中。论文在文本分类和图像分类问题上进行了实验对比。

这是半监督训练的流程图，左侧是有标签数据，右侧是无标签数据。可以看出有标签数据的做法和普通做法没什么区别，而无标签数据采用的一种叫一致性训练的思想（不是这篇论文的成果）：首先对无标签数据做一个增强，然后将增强前的数据和增强后的数据都送进网络，出一个预测结果，将这两个结果算一个KL散度作为无监督的loss，和有监督的loss加在一起做BP。目标函数就是这个样子：

最低0.47元/天解锁文章

博客等级

码龄8年

24
原创

15
点赞

60
收藏

2
粉丝

关注

私信

热门文章

分类专栏

CV 5篇
python 4篇
pytorch 2篇
leetcode 13篇

最新评论

%time与%timeit
杭州的平湖秋月: 图中 timeit 计算时间，是把代码重复 7 次，每次跑 10 个循环，再求平均值和标准差。但是以前的老版本可能是求最佳值，而不是求均值。而且不同版本的 Ipython，可能对重复次数和循环次数的设置不同。详见官方文档： https://ipython.readthedocs.io/en/stable/interactive/magics.html?highlight=%25time#magic-timeit
%time与%timeit
音程: 什么叫做现在去跑时，发生了变化。
超分辨率中PSNR的计算与bicubic插值
cccler: 一般就是用bicubic（bilinear）这类插值算法来做下采样，最多再叠加个噪声
超分辨率中PSNR的计算与bicubic插值
峻菌君: 那请问一般这种下采样技术跟bicubic有关系吗？一般都会选择怎样的下采样技术呢？
超分辨率中PSNR的计算与bicubic插值
cccler: 你是说构造LR-HR训练对吗？刚好反过来，做训练时一般是先有了HR（比如说拍摄来的），然后对HR应用下采样算法获得对应的LR

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。