如何使用没有标签的数据?或者如何用没有标签的数据提升模型效果?

要用到无标签的数据就要给无标签的数据造一个监督训练的目标,常用的造目标的方法:

  1. Pseudo-labeling  可以用现有的数据训练模型,在用模型跑无标签的数据得到一个假的label,用无标签数据和假的label 帮助训练模型,最后再用有label数据finetune
  2. data augmentation 通过对数据做变换,得到和原始数据相近的数据(simCLR),用一致性,或一些其他的指标让网络学习对数据的表征能力; 图像中常见的data augmentation (crop/mixup/rotate/color distorsion/ blur/),语音中常见的变换(调节语速/pitch/gain/加噪声/mixup/spec augment);还有一些用adversarial 的方式生成新的数据(VAT)
  3. 用数据本身作为label, 如nlp中bert 用denoising 的方式 或 用前一段信息作为特征,用后面的信息作为预测label 等
  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
计算机视觉数据集清单是一个列出了常用于计算机视觉相关任务的数据集的清单。这些数据集包含了大量的图像和其相应的标签信息,可以用于模型的训练和测试。 随着深度学习技术的迅猛发展,TensorFlow作为一个流行的开源深度学习框架,提供了丰富的工具和库来支持计算机视觉任务。并且,TensorFlow还提供了许多预训练的模型,可以直接用于各种计算机视觉任务,如图像分类、目标检测和图像分割等。 附赠TensorFlow模型训练和使用教程可以帮助用户更好地理解和应用这些数据集和模型。通过教程,用户可以学习如何使用TensorFlow进行数据集的预处理模型的构建和训练、以及模型的评估和使用。 教程通常包括以下内容: 1. 数据集介绍:介绍数据集的特点、使用场景和数据结构等。 2. 数据处理:教导如何加载和处理数据集,包括数据的读取、数据增强和数据划分等。 3. 模型构建:介绍如何使用TensorFlow构建适用于特定任务的模型,例如卷积神经网络(CNN)用于图像分类或目标检测。 4. 模型训练:讲解如何使用TensorFlow训练模型,包括定义损失函数、选择优化算法和设置超参数等。 5. 模型评估和使用:介绍如何评估训练好的模型,并给出使用模型进行预测和推理的方法和示例。 通过这些教程,用户可以学会使用TensorFlow进行从零开始的模型训练,并且能够针对不同的计算机视觉任务,选择合适的数据集和模型进行实验和应用。这将帮助用户更好地理解计算机视觉任务的实际应用,并提升相关技能和知识。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值