![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
机器翻译
mcg@xisu
机器翻译、自然语言处理、语音翻译
展开
-
机器翻译系统的搭建(Ubuntu10.04+Moses)
机器翻译系统的搭建(Ubuntu10.04+Moses) 因为学习的需要,前一段时间要搭建一个机器翻译系统,最终选择了Moses作为系统的框架,操作系统使用Ubuntu10.04。现对系统的安装流程总结如下: 1、 系统需要的工具(点击超链接可进入相应的下载页面) GIZA++ 翻译模型训练工具 SRILM 语言模型训练工具 Moses原创 2011-10-24 13:34:57 · 2908 阅读 · 0 评论 -
使用ictclas4j进行中文分词
使用ictclas4j进行中文分词 ictclas4j是中科院计算所开发的中文分词工具ICTCLAS的Java版本,因其分词准确率较高,而备受青睐。 1、ictclas4j的下载及使用 1>先从http://ishare.iask.sina.com.cn/f/12821600.html下载ictclas4j的源码包ictclas4j.zip原创 2012-03-03 19:02:32 · 6174 阅读 · 12 评论 -
使用GIZA++进行平行语料的词对齐
使用GIZA++进行平行语料的词对齐 在使用moses搭建机器翻译系统时,词对齐的过程是和模型训练结合在一起的,GIZA++运行的很多细节都被跳过。本文是将GIZA++单独拿出来,关注其从编译、运行到最终获取对齐文件各阶段的细节问题,以求更加深刻地理解GIZA++的工作原理。 1、 编译安装GIZA++ 最新版本的GIZA++可以从下列链接中找到http://code.go原创 2012-08-11 17:05:38 · 4419 阅读 · 1 评论