神经网络机器翻译Neural Machine Translation(1): Encoder-Decoder Architecture

最新推荐文章于 2024-06-25 10:28:53 发布

原创

最新推荐文章于 2024-06-25 10:28:53 发布 · 置顶 · 2.8w 阅读

61 ·

CC 4.0 BY-SA版权

文章标签：

#神经网络 #机器翻译 #端到端 #NMT #LSTM

本文深入探讨了神经网络机器翻译（NMT）中的Encoder-Decoder架构，引用了Kyunghyun Cho等人的研究以及Ilya Sutskever等人的工作，这些工作为统计机器翻译提供了新的视角，利用RNN来学习短语表示，并通过序列到序列学习进行建模。

端到端的神经网络机器翻译（End-to-End Neural Machine Translation）是近几年兴起的一种全新的机器翻译方法。本文首先将简要介绍传统的统计机器翻译方法以及神经网络在机器翻译中的应用，然后介绍NMT中基本的“编码-解码”框架（Encoder-Decoder）。

转载请注明出处：http://blog.csdn.net/u011414416/article/details/51048994

本文中，详细介绍的工作有：
Kyunghyun Cho, Bart van Merrenboer, Caglar Gulcehre Dzmitry Bahdanau, Fethi Bougares, Holger Schwenk, and Yoshua Bengio. 2014. Learning phrase representations using rnn encoder-decoder for statistical machine. In Proceedings of the 2014 Conference on EMNLP, 1724-1734.

Ilya Sutskever, Oriol Vinyals, Quoc V. Le. 2014. Sequence to sequence learning with neural networks. Advances in Neural Information Processing Systems, 4:3104-3112.