【机器翻译】《Gradient-guided Loss Masking for Neural Machine Translation》论文总结

最新推荐文章于 2023-07-08 13:27:52 发布

Tobi_Obito

最新推荐文章于 2023-07-08 13:27:52 发布

阅读量276

点赞数

文章标签：机器翻译自然语言处理人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Tobi_Obito/article/details/125780853

版权

《Gradient-guided Loss Masking for Neural Machine Translation》https://arxiv.org/pdf/2102.13549.pdf这篇论文聚焦机器翻译训练数据集中存在噪音数据的问题，旨在通过干净的数据集来在训练过程中引导模型忽略噪音数据，实现核心是根据干净数据集与训练数据集的训练梯度方向的一致性对Loss进行mask，从而屏蔽将造成干净数据集loss上升的样本影响。

针对问题

当前用于训练机翻模型的数据集中往往包含一些噪音数据，因为在构建过程中一部分数据是人工构建，一部分数据是通过自动化的方式快速构建，后者很难保证质量。训练数据中的噪音将影响机翻模型效果。因此，这篇论文针对这一个问题提出一种由干净数据集“引导”模型带噪学习。关于干净数据集，一方面可以人工从训练数据集中挑选构建，另一方面也可以选择标注质量高的测试集。

核心方法

在已有干净数据集、训练数据集的情况下，问题的关键在于如何用干净数据集来引导模型在训练过程中忽略噪音数据，进

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【机器翻译】《Gradient-guided Loss Masking for Neural Machine Translation》论文总结

这篇论文聚焦机器翻译训练数据集中存在噪音数据的问题，旨在通过干净的数据集来在训练过程中引导模型忽略噪音数据，实现核心是根据干净数据集与训练数据集的训练梯度方向的一致性对Loss进行mask，从而屏蔽将造成干净数据集loss上升的样本影响。...
复制链接

扫一扫

Tobi_Obito CSDN认证博客专家 CSDN认证企业博客

码龄7年

30: 原创

15万+: 周排名

129万+: 总排名

2万+: 访问

: 等级

507: 积分

7: 粉丝

81: 获赞

29: 评论

151: 收藏

私信

关注

分类专栏

tensorflow2 3篇
文本分类 1篇
模型部署 1篇
DFS 4篇
字符串 3篇
BFS 3篇
KMP 1篇
分析 4篇
暴力 1篇
最小生成树 1篇
简单模板 1篇
图 3篇
日期 2篇
模拟 3篇

最新评论

pycharm远程调试报错，运行正常
IT_lw: 博主，请问下，怎么把helper隔离开呢？找不到相关文章了
辨析sklearn.metrics里的average参数：binary/micro/macro/weighted/samples
zhu9shizhu2023: 写的很多，没看懂
辨析sklearn.metrics里的average参数：binary/micro/macro/weighted/samples
xiaobingbuhuitou: 大佬请教一个问题做多标签的时候，pred为([[0, 1, 1], [0, 0, 1]])这样的[batch_size, class]的二值标签，然后labels也是这样的，那么能直接使用‘weight'这类的参数么？
【Tensorflow2安装】Tensorflow2.3-CPU安装避坑指南！！！
Tobi_Obito: 有没有一种可能是更新了呢？看看这篇文章的发布日期
【Tensorflow2安装】Tensorflow2.3-CPU安装避坑指南！！！
™️: 为什么我conda先装了python3.6，再装tf2.3.0它也给我说python版本不兼容…并且提示python必须要3.7或3.8……

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。