中科院计算所的ICTCLAS分词包java

原创 2013年12月04日 17:54:31

中科院计算所的ICTCLAS分词包,之前看文本聚类的时候看过,一直没仔细学。今天,有空,就去官网上下了个ictclas java包ICTCLAS50_Windows_32_JNI, 这个是最新版本。

1:没用eclipse 调试工具。

那个包里面有实例的,自己可以直接用,当然,自己也可以写的。我此次自己写了个实例如下:

import ICTCLAS.I3S.AC.ICTCLAS50;


public class ictclas_demo {
 public static void main(String[] args) {
  try {
   ICTCLAS50 testICTCLAS50 = new ICTCLAS50();
   // 分词所需库的路径
   String argu = ".";
   // 初始化
   if (testICTCLAS50.ICTCLAS_Init(argu.getBytes("GB2312")) == false) {
    System.out.println("Init Fail!");
    return;
   } else {
    System.out.println("Init Succeed!");
   }

   String sInput = "点击下载超女纪敏佳深受观众喜爱。禽流感爆发在非典之后。";
   byte nativeBytes[] = testICTCLAS50.ICTCLAS_ParagraphProcess(
     sInput.getBytes("GB2312"), 0, 0);
   System.out.println(nativeBytes.length);
   String nativeStr = new String(nativeBytes, 0, nativeBytes.length,
     "GB2312");
   System.out.println("The result is :" + nativeStr);
   testICTCLAS50.ICTCLAS_Exit();
  } catch (Exception ex) {
   ex.printStackTrace();
  }
 }
}
以上为本次实例java程序。

操作步骤:

(1)新建自己的工程目录ictclas_demo,把以上程序ictclas_demo.java放进去。

(2)把下载ICTCLAS50_Windows_32_JNI包解压,把其中API文件夹下的所有文件拷贝到自己的工程ictclas_demo目录下。

(2)在命令行下: 切换到ictclas_demo目录下:执行

$ javac ictclas_demo.java

$ java ictclas_demo

(3) 以上无问题,即可看到正确结果:中科院计算所的ICTCLAS <wbr>使用初涉(1)

 

2. eclipse 下如何使用ICTCLAS包。

这个花了好长一段时间,总算搞定了,现在写下来,方便以后查看。

步骤如下:

(1) 新建一个ictclas_demo的eclipse的工程。把ictlcas_demo.java放到src目录下。

(2)为了使用ictclas包,不如把这个包从外面导入工程中。首先在ictclas_demo的工程名,点击右键,点击import,选择,导入File System ,选择导入的目录为我们下载的ICTCLAS50_Windows_32_JNI下的API文件夹,选中所有文件。点击finish。返回到eclipse的Package Explorer下,你就会看见导入的文件目录结构,到这还没完成任务,还要把ICTCLAS这个目录从外面目录下移到src目录下,就可以了。最终的目录结构如下:

中科院计算所的ICTCLAS <wbr>使用初涉(1)

(3)以上没问题的话,就可以Builer Project了,点击Run就可以看到结果了。

同时注意下,在bin目录下,会生成一个ICTCLAS目录,注意,这个目录和src下的那个ICTCLAS目录是不一样的,里面的文件时.class, 而后者是.java文件。

 

相关文章推荐

中科院计算所ICTCLAS

  • 2011年11月10日 20:01
  • 11.55MB
  • 下载

中科院计算所的ICTCLAS 使用初涉

中科院计算所的ICTCLAS分词包,之前看文本聚类的时候看过,一直没仔细学。今天,有空,就去官网上下了个ictclas java包ICTCLAS50_Windows_32_JNI, 这个是最新版本。 ...

考进中科院计算所:我的经历和体会

我叫卢山,是北京交通大学软件学院02级学生,今年4月考上了中科院计算所06年硕士研究生,成绩是365分。其实平心而论,如果保研的那些同学也一起考,一定会比我高很多的。另外,这个分数在考计算所的同学之间...

IT战略规划之流程再造 —2013年中科院计算所培训中心系列公益讲座

IT战略规划之流程再造 —2013年中科院计算所培训中心系列公益讲座   尊敬的女士/先生,您好! 为了感谢您多年来对培训中心的大力支持与信任,为更多企事业单位培养高素管理和技术人才,培训中心...

中科院计算所职业培训中心2014年四季度课程安排

中国科学院计算技术研究所是国家专门的计算技术研究机构,同时也是中国信息化建设的重要支撑单位。中科院计算所培训中心致力于高端IT类人才培养,凭借科学院强大师资力量,在总结多年大型软件开发和组织经验的基础...

中科院计算所培训中心免费技术讲座(主题:大数据前沿技术分析与应用,时间:2017.2.28下午)

中科院计算所培训中心       —2017年技术分享会(大数据前沿技术分析与应用) 随着互联网、移动互联网和物联网的发展,我们已经切实地迎来了一个大数据的时代。如何对海量数据进行挖掘和分析,...

考进中科院计算所:我的经历和体会

我叫卢山,是北京交通大学软件学院02级学生,今年4月考上了中科院计算所06年硕士研究生,成绩是365分。其实平心而论,如果保研的那些同学也一起考,一定会比我高很多的。另外,这个分数在考计算所的同学之间...

致联系报考我免试研究生的同学们-山世光 研究员-中科院计算所

致联系报考我免试研究生的同学们 山世光 2012年8月23日(修订) 各位同学好:       首先,很高兴与你相识。每年具有免试推荐研究生资格的同学都很多,你...

中科院计算所会议

中科院计算所会议1序号     会议名称       会议介绍         代表领域1ACM SIGCOMM: ACM Conf on Communication Architec...
  • josunna
  • josunna
  • 2011年07月07日 22:27
  • 691
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:中科院计算所的ICTCLAS分词包java
举报原因:
原因补充:

(最多只允许输入30个字)