项目中需要对某些内容进行分词步骤,所以在Java中调用中科院ictclas2013版的分词系统
下载网址:http://ictclas.nlpir.org/
1.进入官网下载
下载两个文件。一个是:ictclas2013下载包,目前更新到0416版,另一个是:ictclas2013-Win-32-jni或者64位的。如果系统是32位的就下载32位的,如果是64位的系统,那就要看你安装的java虚拟机是32位还是64位。可以在eclipse 中运行下面的代码得到结果
public class Snippet {
public static void main(String[] args){
String arch = System.getProperty("sun.arch.data.model");
System.out.println(arch);
}
}
若是32为jdk,还是要下载使用32位的JNI,而且Eclipse也用32位的。
2.先新建一个工程,然后打开工程所在目录,把下载到的20130416090617_nlpir_ictclas2013_release文件夹中的所有内容复制过去。
3.将下载到的20130416090323_Win-64bit-JNI-lib文件夹(我的java虚拟机是64位)中的TestNLPIR.java和kevin文件夹复制到到src目录下。
4.将NLPIR.dll和NLPIL_JNI.dll文件同时导入到项目中,使用右键点击项目,import方法,从文件中导入,选择这两个文件
5.新建文件夹命名为file,跟src同级,将Data文件夹放入里面。
6.去eclipse里面打开TestNLPIR.java,改变几行代码:
String argu="../../"; 改成String argu = "./file";
String argu1 = "E:/NLPIR/test/test.TXT"; 改成String argu1 = "./test/test.TXT";
String argu2 = "E:/NLPIR/test/test_result1.TXT"; 改成String argu2 = "./test/test_result1.TXT";
argu2 = "E:/NLPIR/test/test_result2.TXT";改成argu2 = "./test/test_result2.TXT";
运行即可得到结果文件test_result1.TXT和test_result2.TXT