论文笔记:Bridging the Gap between Training and Inference for Neural Machine Translation

本文探讨了神经机器翻译中训练与推理过程之间的差距,包括错误积累和过度纠正问题。提出了两种方法来寻找oracle word:词级别的贪心搜索和句级别的oracle。词级方法基于Gumble Noise选择概率最高的词,而句级方法利用BLEU度量和beam search,但需解决句子长度一致性问题。文章提出强制解码策略,并提出疑问是否能通过注意力机制优化找到oracle word。
摘要由CSDN通过智能技术生成

Motivation

1.训练过程中基于ground truth进行预测,但推理过程中,整个句子都由模型生成,predicted words被fed到模型,可能会造成错误积累。
2.过度纠正问题。

Method

oracle word: 预测词中的ground truth(要自己选出来)
y j − 1 o r a c l e 与 y j − 1 ∗ y^{oracle}_{j-1}与y^*_{j-1} y

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值