一、引言
机器翻译(Machine Translation)是自然语言处理中一个重要的研究方向。它是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。特别是随着机器学习技术的发展,当前机器翻译的主流已经转向基于统计机器学习的方法。在这个过程中,IBM的研究人员提出了一系列的SMT(Statistical Machine Translation)方法,对这个领域的发展起到了至关重要的作用。现在人们习惯上称这一系列的方法为 IBM models。本文将介绍其中最早被提出的一个模型,即IBM 1 model,它主要由Brown 等人在 1993年提出。
欢迎关注白马负金羁的博客 http://blog.csdn.net/baimafujinji ,为保证公式、图表得以正确显示,强烈建议你从该地址上查看原版博文。本博客主要关注方向包括:数字图像处理、算法设计与分析、数据结构、机器学习、数据挖掘、统计分析方法、自然语言处理。
二、统计机器翻译的基础模型
机器翻译领域的先锋,美国科学家Warren Weaver曾经说过:“When I look at an article in Russian, I say: ‘This is really
written in English,