数据增强与数据扩充

数据扩充方法

在图像上很常用:

方法有:左右翻转、随机裁剪、旋转、平移、噪声扰动、亮度对比度变换等许多简单高效的方法;

其作用是增大数据集且提高泛化效果,随手百度都有很多讲解。

在文本上的使用:

方法有:

同义词替换(这种方法比较大的局限性在于同义词在NLP中通常具有比较相近的词向量,因此对于模型来说,并没有起到比较好的对数据增强的作用)

反向翻译(这是机器翻译中一种非常常用的增强数据的方法,主要思想就是通过机器将一个句子翻译为另一种语言,再把另一种语言翻译为原先的语言,得到一个意思相近但表达方式可能不同的句子。这种方法不仅有同义词替换、词语增删的能力,还具有对句子结构语序调整的效果,并能保持与原句子意思相近,是一种非常有效的数据增强方式。)

生成对抗网络(近些年大热的生成对抗网络模型(GAN)以及它的各种变体模型,通过生成器和判别器的相互博弈,不断迭代增强训练达到以假乱真的效果,最后用生成器大量生成数据。但这种方法的难点在于需要对GAN模型的训练达到比较好,才能更有效的生成高质量数据,这一点工作量相对较大也较为复杂。)

来源:

https://www.zhihu.com/question/305256736/answer/586459726?utm_source=wechat_session&utm_medium=social&utm_oi=760907773469790208

 

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值