NLPIR(ICTCLAS2013)分词器的配置及使用

   开发JAVA的程序用ICTCLAS分词确实不怎么舒服,但是没有办法:谁让研究都是以它的分词作为标准的呢!

好了闲话少说,进入正题.

第一步:下载ICTCLAS  

下载地址:

http://ictclas.nlpir.org/upload/20130416090617_nlpir_ictclas2013_release.zip

http://ictclas.nlpir.org/upload/20130416090224_Win-32bit-JNI-lib.zip


第二步:在下载的同时,我们就可以建立新的JAVA项目了。取名ICTCLAS_2013

第三步:下载完成后,把Win-32bit-JNI-lib.zipnlpir_ictclas2013_release.zip解压,

解压后的Win-32bit-JNI-lib.zip截图如下:

232315862.gif

nlpir_ictclas2013_release.zip的截图如下:

232339862.gif

第四步:把Win-32bit-JNI-lib中的kevin目录及TestNLPIR.java复制到项目的src目录下,把NLPIR_JNI.dll复制到ICTCLAS_2013的根目录下。把nlpir_ictclas2013_release.zip中的Datatest目录复制到ICTCLAS_2013的根目录下。

复制成功后,截图如下:

232359281.gif

第五步:修改TestNLPIR.java的源代码,把代码的第31行修改成:

String argu = ".";

然后把4749行修改如下:

//初始化分词组件

String argu1 = "./test/test.TXT";

String argu2 = "./test/test_result1.TXT";

然后把项目中的所有出现:GB2312的地方换成UTF-8
第六步:运行TestNLPIR

结果如下

232412181.jpg

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值