总结了下自己在LINUX下配置ICTCLAS2014的一些经验(仅JAVA调用)
点击这里下载ICTCLAS2014最新版本 点击打开链接
1.解压后打开,其中有个sample文件夹。打开sample文件夹,该文件夹下有一个名为JnaTest_NLPIR的文件夹,将该文件夹导入Eclipse工程中。
2.打开所导入工程中的src/code/下的NlpirTest.java。
3.修改该源程序中两处路径,
第一处:CLibrary Instance = (CLibrary) Native.loadLibrary("", CLibrary.class);将第一个参数改成.so文件所在路径
.so文件在刚才解压的文件夹下的lib文件夹下。例如我刚才将压缩包解压在home下,名为ICTCLAS。则路径为
/home/ICTCLAS/lib/linux64/libNLPIR.so.
第二处:源程序main函数的第一行String argu = "“;填写你的ICTCLAS所在路径。我的就是/home/ICTCLAS
第三处:在main函数中有一句nativeByte = CLibrary.Instance.NLPIR_GetFileKeyWords.....把后面的第一个参数改为某个txt的路径例如path/a.txt(自己指定,保证其中有内容)。
然后运行就OK了。示例程序里只有简单的功能。剩下的还要好好学习下。
以上有问题还请纠正!!
1.如果不要词性,可以将CLibrary.Instance.NLPIR_ParagraphProcess(, );第二个参数设为0
2.添加用户词典
(1)内存方式添加用户词典(仅在此次运行有效)
示例:CLibrary.Instance.NLPIR_AddUserWord("质检总局 n");//带词性
删除刚才用户添加的词典:Instance.NLPIR_DelUsrWord("质检总局”);//不带词性
3.提取关键词Library.Instance.NLPIR_GetKeyWords()
4.执行分词操作CLibrary.Instance.NLPIR_ParagraphProcess()