http://www.cnblogs.com/CheeseZH/archive/2012/11/27/2791037.html
吃水不忘挖井人,这篇文章给了我很大帮助:http://blog.csdn.net/caimo/article/details/7686872,这篇文章写的蛮详细,不过是ICTCLAS在web项目中的应用,于是我借花献佛,把它整理了一下成为java项目的应用。
1、到ICTCLAS官网下载最新版本分词器:http://ictclas.org/ictclas_download.aspx,点击下载后需要填写反馈信息——姓名,邮箱;
注:听学长说这个分词器有时间限制,所以一段时间之后需要重新下载。
2、将下载的ICTCLAS50_Windows_32_JNI.rar解压,其中有API,Demo,Doc,Sample四个文件夹;
API文件夹中的东西就是我们需要使用的;
Demo文件夹中的东西是一个用MFC实现的分词程序;
Doc文件夹中的东西是两个文档,注:ICTCLAS5.0接口文档.doc中提及的部分接口在最新的ICTCLAS中已经不再提供,还有的做了少量修改;
Sample文件夹中是一个java使用ICTCLAS例子:
比如我把ICTCLAS50_Windows_32_JNI.rar解压到C盘根目录,那我只需要在命令行中输入:
cd ICTCLAS50_Windows_32_JNI\Sample\Windows_32_jni_Demo
javac TestMain.java
java TestMain
就可以看到运行结果了;
3、如何将ICTCLAS整合到自己Java 项目中:
在myeclipse中创建项目为ICTCLAS003,那么将ICTCLAS的API目录中的ICTCLAS文件夹拷贝到ICTCLAS003文件夹的src目录下(ctrl+v粘贴到工程src即可),然后把DATA和其他的文件放到ICTCLAS003文件夹中即可。
刷新项目(Refresh)就可以看到这些内容已经导入了;
然后新建一个Test.java,