机器翻译Machine Translation及其Tensorflow代码实现（含注意力attention）

最新推荐文章于 2024-06-17 14:07:30 发布

野营者007

最新推荐文章于 2024-06-17 14:07:30 发布

阅读量2.5k

点赞数 4

分类专栏：自然语言处理(NLP)技术入门文章标签： tensorflow 机器翻译 attention 自然语言处理深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40136685/article/details/111056472

版权

机器翻译

翻译句子 $x$ 从一种语言（源语言）到句子 $y$ 另一种语言（目标语言）。下面这个例子就是从法语转换成为英文。

统计机器翻译

英文是Statistical Machine Translation (SMT)。核心思想是从数据中学习概率模型。
$argmax_y P(y|x) \\\\ = argmax_y P(x|y) P(y)$
公式前一部分 $P (x ∣ y)$ 是翻译模型，负责翻译词和词组。后一部分 $P (y)$ 是语言模型，负责使译文更加流畅。

优点

思路容易理解，有可解释性

缺点

需要大量的特征工程，耗费人力
空间复杂度较高，需要存储额外资源，例如平行语句

对齐

为了训练出一个性能优秀的翻译模型，我们首先需要有很多的平行数据（从原文到译文）。这就需要引出对齐的概念。找到原文中的哪个短语对应到译文中的哪个短语。我们用 $a$ 代表对齐。因此，我们的翻译模型从最大化 $P (x ∣ y)$ 变成了最大化 $P (x, a ∣ y)$ 。对齐的难点就在于原文中可能存在词语没有对应的译文(counterpart)。我们还需要考虑单词在句子中不同位置导致对句意产生的不同的影响。

即便能够进行对应，对齐本身也十分复杂，有可能出现以下3种情况。

多对一

多个译文词组对应一个原文词组。

一对多

一个译文词组对应多个原文词组。类似的词被称为多产词(fertile word)。

多对多

多个译文词组对应多个原文词组。无法进行更细致的拆分。

解码

在对齐之后，我们需要进行翻译。如果使用暴力方法，即枚举所有可能的译文并计算其概率，显然不太现实，因为复杂度太高。更有效的方法是进行启发式搜索算法(heuristic search algorithm)，放弃探索所有可能性较小的译文。

神经机器翻译

英文是Neural Machine Translation (NMT)。模型架构是序列到序列模型(sequence-to-sequence, seq2seq)，详情请参见我的另一篇博客。

在NMT中，我们直接计算 $P (y ∣ x)$ 而不是像SMT拆开计算。
$P(y|x) = P(y_1|x) P(y_2|y_1,x) ... P(y_T|y_1,...,y_{T-1},x)$

最低0.47元/天解锁文章

关注

4
点赞
踩
29

收藏

觉得还不错? 一键收藏
10
评论
机器翻译Machine Translation及其Tensorflow代码实现（含注意力attention）

机器翻译翻译句子xxx从一种语言（源语言）到句子yyy另一种语言（目标语言）。下面这个例子就是从法语转换成为英文。统计机器翻译英文是Statistical Machine Translation (SMT)。核心思想是从数据中学习概率模型。argmaxyP(y∣x)=argmaxyP(x∣y)P(y)argmax_y P(y|x) \\\\= argmax_y P(x|y) P(y)argmaxyP(y∣x)=argmaxyP(x∣y)P(y)公式前一部分P(x∣y)P(x|y)P(x
复制链接

扫一扫

专栏目录

评论 10

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。