开源专区
mcg@xisu
机器翻译、自然语言处理、语音翻译
展开
-
Win+Linux双系统中重装Windows操作系统后Ubuntu系统的恢复
前几天由于对Win7进行了重新安装,就考虑如何能够将原来的ubuntu11.04进行恢复。刚开始想借助于现有的应用软件EasyBCD2.2进行引导,但未能成功,于是就另辟蹊径。经过上网查找和阅读相关书籍,终于找到了多种解决方案。现就将具体的方法总结如下: 针对几款原创 2011-09-20 18:13:55 · 1338 阅读 · 0 评论 -
使用googlecode进行项目管理(Linux)
使用googlecode进行项目管理(Linux) 在进行软件开发时,需要对自己的项目进行有效地管理,这样不仅能够使我们的项目代码看起来更有条理,也会使我们的软件开发过程变得更为高效。googlecode是google提供的一款非常优秀的在线项目管理工具,从最初的项目创建开始,一直到后续的开发、发布、更新,googlecode都会在你输入几个命令之后,帮你完成一系列繁琐的工作。下面就原创 2011-11-05 19:34:39 · 730 阅读 · 0 评论 -
Ubuntu操作系统下笔记本触摸板失效解决之道
Ubuntu操作系统下笔记本触摸板失效解决之道 最近在笔记本上重装完Ubuntu后重启系统,触摸板没有任何反应,以为是计算机本身出现了问题,但回到windows操作系统下,触摸板又能正常工作,可见应该不是硬件的问题。通过在网上查询资料、咨询同学,最终找到了解决这一问题的有效方法,以下是两种方法具体的操作过程: 方法一、 在终端依次输入以下代码:原创 2011-11-06 18:14:06 · 2679 阅读 · 0 评论 -
使用ictclas4j进行中文分词
使用ictclas4j进行中文分词 ictclas4j是中科院计算所开发的中文分词工具ICTCLAS的Java版本,因其分词准确率较高,而备受青睐。 1、ictclas4j的下载及使用 1>先从http://ishare.iask.sina.com.cn/f/12821600.html下载ictclas4j的源码包ictclas4j.zip原创 2012-03-03 19:02:32 · 6280 阅读 · 12 评论 -
使用ictclas4j进行中文分词(续)
使用ictclas4j进行中文分词(续)在对大文件进行中文分词时,出现了以下的错误信息java.lang.ArrayIndexOutOfBoundsException: -39 at java.util.ArrayList.get(ArrayList.java:324) at org.ictclas4j.bean.Dictionary.findInOri原创 2012-03-31 18:57:54 · 2116 阅读 · 4 评论 -
使用GIZA++进行平行语料的词对齐
使用GIZA++进行平行语料的词对齐 在使用moses搭建机器翻译系统时,词对齐的过程是和模型训练结合在一起的,GIZA++运行的很多细节都被跳过。本文是将GIZA++单独拿出来,关注其从编译、运行到最终获取对齐文件各阶段的细节问题,以求更加深刻地理解GIZA++的工作原理。 1、 编译安装GIZA++ 最新版本的GIZA++可以从下列链接中找到http://code.go原创 2012-08-11 17:05:38 · 4442 阅读 · 1 评论