《Reducing Word Omission Errors in Neural Machine Translation:A Contrastive Learning Approach》论文阅读笔记

最新推荐文章于 2025-06-05 16:53:26 发布

竹里沨笙月上门

最新推荐文章于 2025-06-05 16:53:26 发布

阅读量478

点赞数

分类专栏：论文阅读笔记文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40676758/article/details/114546304

版权

论文阅读笔记专栏收录该内容

2 篇文章

订阅专栏

该研究关注神经机器翻译（NMT）系统中存在的单词遗漏问题，并提出使用对比学习（CL）方法来解决。CL通过使模型对正确翻译的概率高于错误翻译，以减少错误。与传统的覆盖模型不同，这种方法不涉及模型结构调整，而是对模型进行微调。实验表明，该方法对动词和介词的遗漏尤为有效，且适用于不同语言，训练快速且模型无关。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Reducing Word Omission Errors in Neural Machine Translation:A Contrastive Learning Approach

基本信息
研究目的
相关工作
方法
- - CL算法
实验
- - 实验
结论
Notes

基本信息

Authors：Zonghan Yang, Yong Cheng, Yang Liu, Maosong Sun

Year：2019

From：ACL

研究目的

NMT SYSTEM倾向于make word omission errors（单词省略的错误）。所以，我们使用contrastive learning（使model分配更高的概率给ground-truth translation；更低的概率给erroneous translation）的方法来解决这个问题。
同时，还要开发一种模型通用的方法来解决NMT中单词省略的问题。

相关工作

Modeling Coverage for NMT
1. SMT中有一个coverage的概念，用以度量source phrase是否被翻译且被翻译一次。为了引入这个量，我们有两种方法：一是调整模型结构来包含coverage、二是在decoder端加入限制。但本文的工作于这些方法不同，因为CL于模型无关。我们使用的方法属于fine-tune
Contrastive Learning in NLP
1.

方法

为了选择正确的句子，我们需要让NMT model给真实的句子分配的概率 > 给错误的句子分配的概率。

CL算法

在这里插入图片描述
第一步：给定一个平行训练集，通过train找到一组model参数，使训练集的log-likelihood最大。

第二步：通过省略y中的单词来构建负样本，这里有三种方法：

random omission: 用随机均方分布来omission
omission by word frequency: 根据词频省略
omission by part of speech: 根据词性省略

第三步：
在这里插入图片描述
N代表一个ground-truth的y产生了几个错误的负样本。

实验

三个baseline
在这里插入图片描述
我们的CL方法：

动词或介词(preposition)

实验

1 BLEU
在这里插入图片描述
2 人类评价

结论

这个方法没有language的限制
这个方法可以快速被train，收敛得快
这个方法是model agonstic的

Notes

n/a

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。