中文分词器ICTCLAS使用方法(Java)

http://www.cnblogs.com/CheeseZH/archive/2012/11/27/2791037.html

吃水不忘挖井人,这篇文章给了我很大帮助:http://blog.csdn.net/caimo/article/details/7686872,这篇文章写的蛮详细,不过是ICTCLAS在web项目中的应用,于是我借花献佛,把它整理了一下成为java项目的应用。

1、到ICTCLAS官网下载最新版本分词器:http://ictclas.org/ictclas_download.aspx,点击下载后需要填写反馈信息——姓名,邮箱;

注:听学长说这个分词器有时间限制,所以一段时间之后需要重新下载。

2、将下载的ICTCLAS50_Windows_32_JNI.rar解压,其中有API,Demo,Doc,Sample四个文件夹;

API文件夹中的东西就是我们需要使用的;

Demo文件夹中的东西是一个用MFC实现的分词程序;

Doc文件夹中的东西是两个文档,注:ICTCLAS5.0接口文档.doc中提及的部分接口在最新的ICTCLAS中已经不再提供,还有的做了少量修改;

Sample文件夹中是一个java使用ICTCLAS例子:

比如我把ICTCLAS50_Windows_32_JNI.rar解压到C盘根目录,那我只需要在命令行中输入:

cd ICTCLAS50_Windows_32_JNI\Sample\Windows_32_jni_Demo

javac TestMain.java

java TestMain

就可以看到运行结果了;

3、如何将ICTCLAS整合到自己Java 项目中:

在myeclipse中创建项目为ICTCLAS003,那么将ICTCLAS的API目录中的ICTCLAS文件夹拷贝到ICTCLAS003文件夹的src目录下(ctrl+v粘贴到工程src即可),然后把DATA和其他的文件放到ICTCLAS003文件夹中即可。

刷新项目(Refresh)就可以看到这些内容已经导入了;

然后新建一个Test.java,

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值