机器翻译
文章平均质量分 73
追梦船
机器学习,自然语言处理方向的小菜鸟
展开
-
A Statistical MT Tutorial Workbook
A Statistical MT Tutorial Workbook 作者:Kevin Knight 本篇文章是统计机器翻译入门级的文章,概要的介绍了如下内容: 1、统计机器翻译的信源信道模型 2、语言模型->估算单语句子的流利度 3、IBM模型1-3,如何进行模型之间的参数转移 4、EM算法,如何解决"鸡生蛋,蛋生鸡"的问题 5、其他最基本的概念,如贝叶斯公式等转载 2014-05-05 17:06:47 · 990 阅读 · 0 评论 -
估计概率构造短语翻译表
经过第三步抽取短语后,获得基于短语系统使用的翻译短语对,而接下来的第四步就是短语翻译表概率估计,它的作用是对翻译短语对的正确性进行合理的评估。 在上一节,我们得到了短语对集合,如下图所示: 在这里,我们估计概率主要进行四个分数的计算,即双向短语翻译概率(正向:“源语言->目标语言”方向;反向:“目标语言->源语言”方向 )、双向词汇化权重。首先,在上图上转载 2014-04-22 09:55:07 · 919 阅读 · 0 评论 -
机器翻译--词语对齐
在上一步预处理完成之后,平行句对中的中文部分都被切分成了相应的短语,而英文的大小写、格式、相应的空格也都加上了,在这之后就可以完成词语对齐的过程了。词语对齐的目标是得到中英文词或短语的对齐信息,便于翻译系统做解码时寻找相应的phrase。 词语对齐这一步一般都采用开源工具完成,比如现在用的最多的GIZA++,但是在平行语料数据量大的情况下,可能其完成整个词语对齐的过程耗时较长。现在也转载 2014-05-15 11:26:18 · 8803 阅读 · 0 评论