RNN与机器翻译

最新推荐文章于 2024-07-24 14:29:40 发布

Alice熹爱学习

最新推荐文章于 2024-07-24 14:29:40 发布

阅读量6.5k

点赞数 2

分类专栏：自然语言处理自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/aliceyangxi1987/article/details/71055235

版权

本文介绍了机器翻译系统的组成部分和挑战，特别是翻译模型和语言模型。深入探讨了RNN模型，包括GRU和LSTM，以及它们在解决长期依赖问题上的改进。GRU和LSTM通过门控机制来管理记忆，从而在机器翻译任务中表现优越。

摘要由CSDN通过智能技术生成

CS224d-Day 9:
GRUs and LSTMs – for machine translation
视频链接
 课件链接

本文结构：
- 机器翻译系统整体的认识
- 什么是 parallel corpora
- 三个模块
- 各模块有什么难点

RNN 模型
- 最简单的 RNN 模型
- 扩展模型
- GRU:
- LSTM

下面是video的笔记：

1.机器翻译

机器翻译是NLP问题中比较难的其中之一，为了解决这个问题，有一些很好玩的模型：

Gated Recurrent Units by Cho et al. (2014)
http://arxiv.org/pdf/1412.3555v1.pdf
http://arxiv.org/pdf/1502.02367v3.pdf
Long-Short-Term-Memories by Hochreiter and Schmidhuber (1997)
http://web.eecs.utk.edu/~itamar/courses/ECE-692/Bobby_paper1.pdf

LSTM 是很早以前的模型，GRU 是比较新的。

过去的方式很传统，现在的 Deep Learning 是基于统计的，它们以 parallel corpora 为基础。

什么是 parallel corpora？
是个很大的 corpora，句子和段落都是对齐的.

比如 European Parliament，欧洲议会的笔记，它们被欧盟的所有语言所记录，所以你会看到一句英语，法语，意大利语，德语等等。

通常我们只需要一对语言，也就是一句翻译成一句。
此外我们也有翻译整段文字的场景，一样的，这个时候就是段落的对齐。

这是一个非常复杂的系统，先做一个整体的认识，然后再看具体的模块：

例如输入的语言是 French，目标语言是 English，我们希望翻译的概率达到最大。
也就是，如果给了f，它被翻译成e^的概率最大，那e^就是翻译的结果。

这里有三个模块:

第一个是 Translation Model，是通

最低0.47元/天解锁文章

Alice熹爱学习

关注

2
点赞
踩
13

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。