RNN与机器翻译

本文介绍了机器翻译系统的组成部分和挑战,特别是翻译模型和语言模型。深入探讨了RNN模型,包括GRU和LSTM,以及它们在解决长期依赖问题上的改进。GRU和LSTM通过门控机制来管理记忆,从而在机器翻译任务中表现优越。
摘要由CSDN通过智能技术生成

CS224d-Day 9:
GRUs and LSTMs – for machine translation
视频链接
课件链接


本文结构:
- 机器翻译系统整体的认识
- 什么是 parallel corpora
- 三个模块
- 各模块有什么难点

  • RNN 模型
    • 最简单的 RNN 模型
    • 扩展模型
    • GRU:
    • LSTM

下面是video的笔记:

1.机器翻译

机器翻译是NLP问题中比较难的其中之一,为了解决这个问题,有一些很好玩的模型:

LSTM 是很早以前的模型,GRU 是比较新的。

过去的方式很传统,现在的 Deep Learning 是基于统计的,它们以 parallel corpora 为基础。

什么是 parallel corpora?
是个很大的 corpora,句子和段落都是对齐的.

比如 European Parliament,欧洲议会 的笔记,它们被欧盟的所有语言所记录,所以你会看到一句英语,法语,意大利语,德语等等。

通常我们只需要一对语言,也就是一句翻译成一句。
此外我们也有翻译整段文字的场景,一样的,这个时候就是段落的对齐。

这是一个非常复杂的系统,先做一个整体的认识,然后再看具体的模块:

例如输入的语言是 French,目标语言是 English,我们希望翻译的概率达到最大。
也就是,如果给了f,它被翻译成e^的概率最大,那e^就是翻译的结果。

这里有三个模块:

第一个是 Translation Model,是通

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值