【ICLR2022】序列生成的目标侧数据增强

0c6c165f699c5f2a1becc4e8a462d92c.png

来源:专知
本文为论文,建议阅读5分钟本文提出了一种生成端的数据增强方法。

0ae97014bd73cd6dedf4da621d52e363.png

论文题目:Target-Side Data Augmentation for Sequence Generation

作者:解曙方,吕昂,夏应策,吴郦军,秦涛,刘铁岩,严睿

通讯作者:严睿

论文概述:自回归序列生成是机器学习和自然语言处理中的一个重要方法。每个元素在生成的时候,它同时基于输入条件和已经生成的元素。之前的数据增强方法,虽然已经在各种任务上取得的显著的效果,却只是被运用在了输入条件上。例如在输入的序列中增加噪声,或进行随机替换,打乱,掩码等操作。这些方法都忽视了对已生成元素的增强。本文提出了一种生成端的数据增强方法。在训练阶段,我们使用解码器的输出作为软标签,与真实数据一起生成增强的数据。这些增强数据则进一步用来训练解码器。我们在多个序列生成任务上进行了实验,包括对话生成,机器翻译,和摘要生成。在不使用额外数据和额外的模型参数的情况下,我们的方法在所有指标上显著的高于许多强力的基线模型,充分证明了我们的算法的有效性。

https://openreview.net/forum?id=pz1euXohm4H

846724b4e772781e3cbe3a0028e907c6.png

f58f1f860a3a671f855f9f1a0ea2fadd.png

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值