如何使用没有标签的数据？或者如何用没有标签的数据提升模型效果？

最新推荐文章于 2023-04-23 13:02:00 发布

啥哈哈哈

最新推荐文章于 2023-04-23 13:02:00 发布

阅读量3.2k

点赞数

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cuifan0814/article/details/104659817

版权

深度学习专栏收录该内容

12 篇文章 0 订阅

订阅专栏

要用到无标签的数据就要给无标签的数据造一个监督训练的目标，常用的造目标的方法：

Pseudo-labeling 可以用现有的数据训练模型，在用模型跑无标签的数据得到一个假的label，用无标签数据和假的label 帮助训练模型，最后再用有label数据finetune
data augmentation 通过对数据做变换，得到和原始数据相近的数据（simCLR），用一致性，或一些其他的指标让网络学习对数据的表征能力；图像中常见的data augmentation （crop/mixup/rotate/color distorsion/ blur/），语音中常见的变换（调节语速/pitch/gain/加噪声/mixup/spec augment）；还有一些用adversarial 的方式生成新的数据（VAT）
用数据本身作为label，如nlp中bert 用denoising 的方式或用前一段信息作为特征，用后面的信息作为预测label 等

关注

0
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
如何使用没有标签的数据？或者如何用没有标签的数据提升模型效果？

要用到无标签的数据就要给无标签的数据造一个监督训练的目标，常用的造目标的方法：Pseudo-labeling 可以用现有的数据训练模型，在用模型跑无标签的数据得到一个假的label，用无标签数据和假的label 帮助训练模型，最后再用有label数据finetune data augmentation 通过对数据做变换，得到和原始数据相近的数据（simCLR），用一致性，或一些其他的指标让...
复制链接

扫一扫

专栏目录

啥哈哈哈 CSDN认证博客专家 CSDN认证企业博客

码龄12年

35: 原创

11万+: 周排名

119万+: 总排名

7万+: 访问

: 等级

888: 积分

17: 粉丝

22: 获赞

5: 评论

124: 收藏

私信

关注

热门文章

分类专栏

工具学习 5篇
语音相关 4篇
学习 2篇
图像工程 1篇
机器学习 12篇
深度学习 12篇
python 7篇

最新评论

图像梯度域融合
luluio2000: 你好，混合梯度融合那部分有没有参考文献的题目啊，想详细学习原理，谢谢
git 学习（git fetch/ git pull/ git rebase/ git cherry-pick的区别）
Datrilla: git merge 那是不是带默认选项更清晰？ ours什么的。
Clustering by Passing Messages Between Data Points
qq_40598437: 请问，AP算法中，为何相似度矩阵为负值矩阵？为何取负的欧氏距离？
pytorch DistributedDataParallel 多卡训练结果变差的问题分析
AI吃大瓜: 可以参考一下这篇博客《PyTorch多卡分布式训练DistributedDataParallel 使用方法》：https://blog.csdn.net/guyuealian/article/details/122702287
使用mpld3
星恒千夏: 请问我生成的。html文件有大小但是怎么打开是空白的？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。