论文笔记：Towards Zero Unknown Word in Neural Machine Translation

最新推荐文章于 2024-03-11 11:26:54 发布

暴躁的猴子

最新推荐文章于 2024-03-11 11:26:54 发布

阅读量570

点赞数 2

文章标签：论文 NLP 机器翻译未登录词

本文链接：https://blog.csdn.net/orangefly0214/article/details/84832853

版权

摘要：

NMT由于考虑到计算的复杂度，因此都使用一个受限词表，这样会导致很多单词成了词表外的OOV词，而这种OOV词在翻译时很难处理并且打破了句子结构，增加了语句的歧义性，为了解决这个问题，提出了一种新的替换-翻译-恢复的方法。

1）.在替换阶段，集外词由单语数据中学到的相似的集内词替换。

2）.在翻译和恢复阶段，将会使用替换集外词后的双语语料模型进行翻译。

3）.最后替换单词的翻译结果将会被替换前的单词代替。

1.introduction

大多数NMT将源端和目标端词典限制在30k到80k的高频词，将所有的rare word转换为UNK，一个很明显的问题是：

1）.如果源端词是OOV或者它的翻译的词是OOV，这个模型在测试阶段很难为这个词生成合适的翻译结果。

2）.让rare words变为毫无意义的unk将会增加句子的歧义，这就会使一部分结构相同部分单词不同但都是OOV的句子出现一样的翻译结果。

举例：

为了解决这个问题，我们提出了一种新颖的基于相似度替换rare word的方法，

具体做法：

1）.在训练阶段，首先引出由双语语料产生的词对齐，每个无论是源端还是目标端包含rare word的词对齐对儿将会被具有相似意义的in-vocabulary words代替（这个相似模型是从一个很大的单语语料中学到的&#

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

暴躁的猴子

关注关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

【论文阅读】Addressing the RareWord Problem in NeuralMachine Translation

独钓寒江雪

06-19

1187

论文作者：Minh Tang Luon (Stanford University) Iiya Sutskever (Google) Quoc V.Le (Google) Orial Vinyals (Google) Wojciech Zaremba (New York Univerity) 这篇论文一看就感觉是一个很好的研究工作，对一个很具体又很重要的问题展开。摘要文章的方法是在经过对齐算

[持续更新] 神经机器翻译论文汇总 Papers on Neural Machine Translation

Riddlesky的专栏

02-15

5186

[持续更新] 神经机器翻译论文汇总Papers on Neural Machine Translation 博主在这里尽可能地整理些神经机器翻译相关的重要论文，大概按照下面的条目分类，不同类别中有互相覆盖的~ 另外作者根据个人喜好，个人喜好，个人喜好给一些靠近知识树根节点的 or 开辟新领域的 or 实验超完整的 or 原作者公布源代码的 or 几乎终结某领域的论文打了星号（★）作为评分，

参与评论您还未登录，请先登录后发表或查看评论

Vscode中字符串报错：Unknown word.cSpell

u012514113的专栏

11-28

5336

是vscode IDE工具中的插件 Code Spell Checker 会检查字符串的合理性，我们写的中式拼音的字符串，不是一个标准英文单词，就会提示错误，解决方法就是让该插件遇到特定词汇不报错。

Vscode出现“axios“: Unknown word处理

weixin_42202992的博客

02-23

1768

Vscode出现"axios": Unknown word处理方法

vscode编辑器中代码出现蓝色波浪线，提示显示 xxxx: Unknown word.cSpell报错

我是天才很好

05-22

3840

安装了拼写检查插件（比如Code Spell Checker），禁用或者卸载即可。

VS code：代码出现蓝色波浪线，提示显示 xxxx: Unknown word.cSpell

Johnlone_的博客

03-29

1万+

vs code 代码出现波浪线

【2011-2016】 NIPS汇总 - Advances in Neural Information Processing Systems

Testing的博客

10-02

1万+

Advances in Neural Information Processing Systems 24 (NIPS 2011) The papers below appear in Advances in Neural Information Processing Systems 24 edited by J. Shawe-Taylor and R.S. Zemel and P.L.

【论文阅读笔记】NeurIPS2020文章列表Part1

热门推荐

zincrain的博客

12-09

2万+

【论文阅读笔记】NeurIPS2020文章列表Part2

zincrain的博客

12-09

6214

Online Multitask Learning with Long-Term Memory Fewer is More: A Deep Graph Metric Learning Perspective Using Fewer Proxies Adaptive Graph Convolutional Recurrent Network for Traffic Forecasting On Reward-Free Reinforcement Learning with Linear Function A.

解决 Vue3 + stylelint14 + SCSS + VSCode 没效果和报错 Unknown word (CssSyntaxError)

qq1014156094的博客

01-12

1万+

原因安装的插件 stylelint、stylelint-config-standard、stylelint-scss 版本太新，对于 vue3 文件的支持不好。解决办法 npm install --save-dev postcss-html stylelint-config-recommended-vue 和 npm install --save-dev stylelint-config-standard-scss 并且进行配置，详情可查看官方迁移说明 https://github.com/stylel

cspell-words

03-26

拼写单词我的自定义单词列表。如果要使用此列表，可以打开.vscode文件夹并编辑settings.json文件。只需将此仓库中的settings.json文件的内容粘贴到项目的.vscode / settings.json文件中即可。右括号之前的功能与右括号之前的功能相同。如果要执行后者，请确保在最后一项之后加上逗号，然后在该项目之后取消尾部逗号，以便settings.json仍然是有效的JSON。

code spell checker插件规避掉一些特定词汇报错“xxx“: Unknown word.cSpell

angrynouse的博客

07-18

3905

让code spell checker插件遇到特定词汇不报错。插件codespellchecker检测到axios不是一个拼写正确的词汇，所以报错。 Unknow word.cSpell

“antd“: Unknown word.cSpell

weixin_46600931的博客

03-11

1162

你遇到的问题是 VS Code 的 Code Spell Checker 插件在检查拼写时，将 "antd" 标记为未知单词。"antd" 是 Ant Design 的缩写，是一个流行的 React UI 库，不是一个英语单词，所以 Spell Checker 会将其标记为错误。要解决这个问题，你可以将 "antd" 添加到 Code Spell Checker 的用户词典中，这样它就不会再被标记为错误了。

[ THUNLP-MT(9/10) ] Neural Machine Translation of Rare Words with Subword Units | Byte Pair Encoding

世界上有很多的东西

05-15

976

Sennrich在ACL'2016发表的论文，主要研究神经机器翻译模型中的未登录词问题，提出了Byte Pair Encoding方法，同时该方法也解决了词表过大的问题。本文在介绍Sennrich的研究工作的基础上，也介绍了中文对于未登录词的相关方法。

PaperWeekly 第七期

weixin_34245082的博客

08-01

130

神经网络机器翻译(NMT)是seq2seq模型的典型应用，从2014年提出开始，其性能就接近于传统的基于词组的机器翻译方法，随后，研究人员不断改进seq2seq模型，包括引入注意力模型、使用外部记忆机制、使用半监督学习和修改训练准则等方法，在短短2年时间内使得NMT的性能超过了传统的基于词组的机器翻译方法。在27号谷歌宣布推出谷歌神经网络机器翻译系统，实...

[资源帖]IJCAI 2016 下载地址

波大菜菜

12-17

2万+

从IJCAI官网上爬取HTTP源码.然后进行按要求修改成下载地址. 分享一下百度网盘下载地址：http://pan.baidu.com/s/1mikAiPa密码：7tp7 失效后请与我联系：1511082629@nbu.edu.cn 下面是pdf名称与里边论文题目的映射关系000.pdf Preface 001.pdf Conference Organization 002.pdf Pr

Module build failed: Unknown word，无法读取css文件

前端

04-10

1万+

在写Vue程序过程中遇到错误： ERROR in ./src/assests/styles/test.css Module build failed: Unknown word (2:1) 1 | > 2 | var content = require("!!./test.css"); | ^ 3 | 4 | if(typeof content === 'string...

ubuntu下的VScode 中文件夹无法打开显示Unknown

qq_40701060的博客

11-19

1964

chmod 777 该文件夹即可

VS Code中写Python代码时遇到出现蓝色波浪线警告 "Dayday": Unknown word. cSpell [4, 40]的解决办法

shugangheshang的博客

03-05

1万+

图1：警告提示图2：小灯泡当鼠标放在警告的感叹号上时，会有小灯泡的提示图标，点击小灯泡会有图三的提示。图3：提示建议根据错误提示建议可以知道python的字典中没有这个字，是什么原因造成这个问题呢，在度娘上找了半天只找到了出现红色和绿色波浪线时的解决办法，但没找到出现蓝色波浪线的解决办法。进过思考发现文件的命名方式有问题。我的文件保存路径为F:\Code\Python\example...

AODRaw: Towards RAW Object Detection in Diverse Conditions

最新发布

03-29

### AODRaw在不同条件下的RAW对象检测 AODRaw 是一种专注于处理原始图像数据（RAW 数据）的对象检测方法。其设计目标是在不依赖传统 JPEG 或其他压缩格式的情况下，直接从相机传感器捕获的 RAW 图像中提取特征并完成对象检测任务。这种方法的优势在于能够保留更多的细节信息，从而提高检测精度。 #### 原始点云与网格模型的关系尽管 AODRaw 的主要应用场景并非点云或网格结构的数据，但可以借鉴类似的理论基础来理解其工作原理。例如，在三维重建领域，点云表示物体为空间中的离散点集合[^1]。然而，由于缺乏连接性信息，这些点之间的关系难以被有效利用。相比之下，基于网格的方法通过定义顶点间的拓扑关系提供了更丰富的几何描述。这种对比启发我们思考如何在二维平面内构建像素级关联以增强 RAW 数据的表现力。 #### 高效架构搜索策略的应用为了优化 AODRaw 的性能表现，研究者引入了一种名为 RANK-NOSH 的高效预测器驱动型神经网络架构搜索算法[^2]。该技术采用非均匀连续削减机制筛选候选解空间内的潜在优秀配置方案，并结合排名估计进一步缩小探索范围直至找到最优子网结构为止。此过程显著降低了计算成本的同时还保持了较高的准确性水平。 #### 边缘设备上的AI模型管理实践当考虑将 AODRaw 应用于实际场景时，则不可避免地涉及到部署于资源受限环境(如移动终端)上运行这一挑战。此时就需要一套完善的解决方案来进行有效的版本控制、实时监控以及周期性的参数调整操作[^3]。只有这样才能确保即使面对不断变化的实际拍摄状况也能维持稳定可靠的识别效果。以下是针对上述讨论提出的几个具体实现方向或者改进思路： ```python import torch.nn as nn class AODRawDetector(nn.Module): def __init__(self, backbone='resnet', num_classes=80): super(AODRawDetector, self).__init__() # Backbone initialization based on selected architecture. if backbone == 'resnet': from torchvision.models import resnet50 self.backbone = resnet50(pretrained=True) elif backbone == 'custom': pass # Customized lightweight network design here. # Additional layers tailored specifically towards handling raw image inputs. self.raw_preprocessor = nn.Sequential( nn.Conv2d(in_channels=4, out_channels=64, kernel_size=7), nn.ReLU(), ... ) def forward(self, x): processed_x = self.raw_preprocessor(x) features = self.backbone(processed_x) return features ``` 以上代码片段展示了一个简化版的 AODRaw 检测框架雏形。其中包含了预处理器模块用来适配来自 CMOS/CCD 芯片未经加工过的四通道 Bayer Pattern 输入；同时也预留接口允许替换不同的骨干网络组件满足特定需求。 ---