note: NMT by jointly learning to align and translate

最新推荐文章于 2020-10-31 21:13:17 发布

hao像飘在外太空

最新推荐文章于 2020-10-31 21:13:17 发布

阅读量196

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/sinat_24070543/article/details/83317398

版权

机器学习专栏收录该内容

14 篇文章 0 订阅

订阅专栏

Bahdanau / Cho / Bengio

Introduction

最近提出的NMT模型都属于encoder-decorder这一大类，

这种encoder-decoder的架构会把所有输入的信息压缩成一个固定长度的向量，
这导致了一个潜在问题：处理长句子很吃力。

Cho也表明encoder-decoder面对长句子，性能就开始快速下降。

为了解决这个问题，我们引入一个“插件”，它能同时学习词语的align（对称）和翻译：生成翻译的时候，从输入的句子中“搜索”（或者说“软搜索”）最相关的信息。
然后根据 1.来源句子中搜索到的位置信息，以及 2.之前已经翻译出的词，来预测下一个词。

这个新的方法不仅取得了和phrase-based system相当的效果，
它还得到了alignments，定性分析表明这个和我们的直觉很相近。

而且，关键的是，它不会把整个输入信息放进一个固定长度的向量中。

它会把输入信息转换成一个向量序列，翻译的时候，根据需要，从序列中挑出一个子集。

Background: NMT

从概率的视角，翻译就是根据给定的输入X，找到目标句子Y的条件概率。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

hao像飘在外太空

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Graph Neural Networks: A Review of Methods and Applications（图神经网络：方法与应用综述）

weixin_41697507的博客

07-06

5367

Graph Neural Networks: A Review of Methods and Applications Jie Zhou , Ganqu Cui , Zhengyan Zhang , Cheng Yang, Zhiyuan Liu, Lifeng Wang, Changcheng Li, Maosong Sun Abstract—Lots of learning tasks req...

transformer详解：transformer/ universal transformer/ transformer-XL

彼得.攀的blog

10-08

1875

首发自彼得攀的小站特别鸣谢刘陆琛@Mayouji在本文写作过程中的帮助 Attention机制在NLP领域的应用最早可以追朔到2014年，Bengio团队将Attention引入NMT(神经机器翻译)任务 [1]。之后更是在深度学习的各个领域得到了广泛应用：如CV中用于捕捉图像上的感受野；NLP中定位关键token/feature. 作为某种程度上可以称为当下NLP领域最强的特征抽取器的tran...

参与评论您还未登录，请先登录后发表或查看评论

NMT十篇必读论文（四）Neural Machine Translation by Jointly Learning to Align and Translate

啊噗啊噗

01-07

742

清华大学NLP整理的神经机器翻译reading list中提到了十篇必读论文 https://github.com/THUNLP-MT/MT-Reading-List 此篇是Bahdanau首先在NLP领域提出attention机制的论文，具有重要意义可以参考： https://blog.csdn.net/weixin_40240670/article/details/812248...

Jointly Learning to Align and Translate with Transformer Models翻译

nopSled

08-13

444

【论文阅读】Neural Machine Translation By Jointly Learning To Align and Translate

热门推荐

独钓寒江雪

06-13

1万+

Neural Machine Translation By Jointly Learning To Align and Translate二作与三作 Universite de Montreal 鼎鼎有名的蒙特利尔大学，最后一位 Yoshua Bengio. 该文章的引用量： 1478这篇文章在神经网络采用编码-解码RNN 做端到端的机器翻译的基础上，使得模型可以在预测下一个词的时候，自动地

NEURAL MACHINE TRANSLATION BY JOINTLY LEARNING TO ALIGN AND TRANSLATE

因为懂得的博客

06-11

3215

title：基于联合学习对齐和翻译的神经机器翻译作者：Dzmitry Bahdanau，KyungHyun Cho ，Yoshua Bengio 发表会议及时间：ICLR 2015 1、机器翻译简介机器翻译，又叫自动翻译，是人工智能的重要任务之一，是利用计算机将一种自然语言转换成另一种自然语言的过程。它的本质问题是如何实现两种不同语言语言之间的信息等价转换，如何表示信息，如...

<模型汇总_4>神经翻译模型（NMT）新宠_Adversarial Neural Machine Translation_Adversarial-NMT

lqfarmer的博客

05-01

6912

前面介绍了牛逼的CNN（Convolutional Neural Network）、深度学习加速神器BNN（Binarized neural network）和深度学习中最贪玩的模型dual-learning NMT，感兴趣的同学可以添加微信公众号“深度学习与NLP”，回复关键词“CNN”、“BNN”或“dual”获取对应文章链接。今天我们讲讲NMT领域的新宠儿Adversarial-

Neural Machine Translation by Jointly Learning to Align and Translate.pdf

06-19

#### 四、联合学习对齐和翻译（Jointly Learning to Align and Translate） - **概念**：该方法结合了注意力机制和传统的编码器-解码器架构，使得模型不仅能够学习翻译，还能同时学习源句子和目标句子之间的对齐...

【论文笔记】Neural Machine Translation by Jointly Learning to Align and Translate

人间不值得

11-05

1万+

Neural Machine Translation by Jointly Learning to Align and Translate --这篇论文算是在自然语言处理(NLP)中或是encoder-decoder中第一个使用attention机制的工作，将attention机制用到了神经网络机器翻译(NMT) 。 Abstract 神经机器翻译是最近提出的一种机器翻译的方法。不像传统...

[论文阅读]Neural Machine Translation By Jointly Learning to Align and Translate

ZY_miao的博客

10-31

1460

文章目录前言摘要一、神经机器翻译1、机器翻译2、基于RNN的Encoder-Decoder架构二、文章贡献三、模型架构1.译码器：整体概述2.编码器：用于注释序列的双向RNN四、实验设置五、代码实现六、结果分析总结前言论文名：Neural Machine Translation By Jointly Learning to Align and Translate 论文作者：Dzmitry Bahdanau et.al. 期刊/会议名：ICLR 2015 本文作者：XMU_MIAO 摘要神经机器翻

Neural Machine Translation by Jointly Learning to Align and Translate 学习笔记

Doron15的博客

08-20

1605

Neural Machine Translation by Jointly Learning to Align and Translate 学习笔记本文就Neural Machine Translation by Jointly Learning to Align and Translate 一文进行学习总结，有何不妥的地方，烦请各位指正。 Neural Machine Translat...

第4篇-《Neural Machine Translation by Jointly Learning To Align and Translate》（基于attention机制神经机器翻译）精读分享

Haitaifantuan

10-09

997

《Neural Machine Translation by Jointly Learning To Align and Translate》阅读心得分享论文原文链接论文导读论文abstract和introduction 论文原文链接《Neural Machine Translation by Jointly Learning To Align and Translate》论文导读论文abs...

论文笔记(attention 1)----NEURAL MACHINE TRANSLATION BY JOINTLY LEARNING TO ALIGN AND TRANSLATE

hx14301009的博客

05-25

2046

1. weakness of simple RNNenc Architecture 传统的neural machine translation 大都是基于encoder-decoder模型，即通过一个encoder将源句子编码成一个固定长度的向量表示，再使用decoder将这个向量作为输入，然后获得输出。这样的话，Encoder需要将整个句子编码到一个固定长度的向量，如果句子长度不大，还OK...

论文阅读：《Neural Machine Translation by Jointly Learning to Align and Translate》

05-31

1万+

神经机器翻译是最近提出的机器翻译方法。与传统的统计机器翻译不同，神经机器翻译的目标是建立一个单一的神经网络，可以共同调整以最大化翻译性能。最近提出的用于神经机器翻译的模型经常属于编码器 - 译码器族，并且将源句子编码成固定长度的矢量，解码器从该矢量生成翻译。在本文中，我们推测使用固定长度向量是提高这种基本编码器 - 解码器架构性能的瓶颈，并且建议通过允许模型自动（软）搜索零件来扩展它的源句子与预测目标词相关，而不必将这些部分明确地形成为硬分段。

解决vscode中Module 'torch' has no 'xxx' member

hao像飘在外太空的博客

10-02

9264

vscode setting中搜索Pylint Path 把地址改成虚拟环境中的pylint 比如我的 /Users/Rogers/.virtualenvs/my_env/bin/pylint

Mac opencv 3.0 + python 3.6 安装踩坑全记录，总有一个坑是你要踩的

hao像飘在外太空的博客

06-26

5156

这个教程是主线：http://www.pyimagesearch.com/2015/06/29/install-opencv-3-0-and-python-3-4-on-osx/ [你可以把我这篇博客当作是它的注解]根据它， 1. Install Xcode， 2. Setup Homebrew 3. homebrew安装 Python 3 4. virt

卷积神经网络权值共享是什么简单易懂版

hao像飘在外太空的博客

06-19

3959

要知道权值共享，先要知道这里面的权值是什么，要知道权值是什么，先要知道卷积的具体内涵是什么首先，卷积是什么鬼意思？卷积的过程可以看成是滤波的过程，卷积核也可以叫做滤波器，所以大家把它叫做filter （我自己编的）你肯定知道函数映射，函数接受input，然后得出output， '卷积'，也是一个类似函数映射的过程和函数的区别就是：它把input切成很多小的部分，然后分别把这些小的部

Jupyter在mac上环境搭建踩的坑，记录一下

hao像飘在外太空的博客

05-17

2176

使用镜像来安装conda每次都安装失败，我还以为是我机器问题，我想说提示很不明显，加上stackoverflow上的各种错误诱导，其实只是网络不好，而已百度一个国内的conda镜像，秒秒钟解决问题用pyenv要修改~/.bash_profile不然使用python指令还是原来版本的pythonpyenv 设置全局版本有时候失效然后用pyenv local指令设置当前文件夹的pytho