java配置2016版NLPIR/ICTCLA系统遇到的一系列问题

因为毕设选择了自然语言处理方向的题目,所以入了这个坑,按照老师的指点,需要使用张华平老师的NLPIR分词系统做分词相关的工作,然后根据各位大佬的博客自己动手配了配。只能说每个人的问题都是不一样的,我在这里简单地写一下自己的配置过程和遇到的问题,一是留作往日的回顾而是尽可能帮助像我一样的新人上手。

首先,先到NLPIR官网下载最新的版本,我下载的是2016版

附上链接:http://ictclas.nlpir.org/downloads

解压后文件结构这样婶的。。。


然后按照这个博主的方法操作:

http://blog.csdn.net/churximi/article/details/50895500

实现步骤

    1、在Netbeans中,文件→新建项目→java→java应用程序;项目名称:CWordSeg;

    2、将NLPIR文件下…\sample\JnaTest_NLPIR\src\code中NlpirTest.java里的代码拷贝到CWordSeg.java里面;

    初步修改代码为下图所示:

    

   (1)将package包声明修改为cwordseg;
   (2)将类名NlpirTest重命名重构为CWordSeg;
    方法:右键CwordSeg.java→重构→重命名,改名为CWordSeg→重构;

    如果只是直接修改代码里的类名,则仍然需要进行重构,否则运行时会报错:找不到主类CWordSeg。

    3、将NLPIR文件下…\sample\JnaTest_NLPIR\src下的utils文件夹直接拷贝到项目CWordSeg的src文件夹中;

    4、将NLPIR文件下…\sample\JnaTest_NLPIR\lib下的jna-4.0.0.jar导入到工程库中;
    方法:复制过来,右键jna-4.0.0.jar,构建路径,添加至构建路径,完成,这时候CwordSeg.java中的引用就不报错了。

    5、在工程CWordSeg文件夹中新建文件夹file:
    (1)将NLPIR中的Data文件夹全部拷贝到file文件夹中;(注意此时要将上图刚解压的Data复制过来,不要复制sample里的)
    (2)将…\lib\win64文件夹也全部拷贝到file文件夹(注意:如果是win32或linux请选择对应的文件夹)。

    6、修改部分代码:
    (1)修改文件NLPIR.dll所在的路径,它在第5步中拷入的win64文件夹中,例如:
    D:\\NetBeansProjects\\CWordSeg\\file\win64\\NLPIR
    注意:最后的NLPIR是文件名,不要加后缀.dll。亲测,如果是64位操作系统,使用32位的文件将会报错。

    

    (2)修Data文件夹所在的路径(即第5步中的Data文件夹),如下图所示:
    D:\\NetBeansProjects\\CWordSeg\\file

   



正常情况下按照这位博主大佬的方法应该已经完成搭建了,然而,作为一个小白,不出一点问题那就显得太不合情理了,接下来我就说一下我遇到的问题。

1)路径配置错误。在修改文件NLPIR.dll所在的路径时,个人建议路径中不要带有中文,因为我遇到过fail reason is Cannot Open Configure file D:...\Data\Configure.xml 这种错误,将中文路径改成纯英文,且正确书写NLPIR.dll所在位置后,就不报错了。

2)授权问题。这个也是刚刚那位博主没有提到的,但是会经常发生的一个事情。NPLIR是有授权期的,如果过期的话,就会报错\Data\NLPIR.user Not valid license or your license expired! Please feel free to contact pipy_zhang@msn.com! 

这个时候就需要去https://github.com/NLPIR-team/NLPIR/tree/master/License这里下载最新的授权文件。这里说一个插曲,因为好奇,去上层目录license里看了看,说是有一个可以自动检测文件是否过期的软件,于是下载以后尝试,没法运行,目前还没解决。。。

当然,网上也有很多大神写了自动获取授权的脚本,因为时间原因,没有去仔细研究,有兴趣的朋友可以自行搜索尝试。

3)控制台无显示,莫名停止运行。这个是困扰了我最久的问题,后来上网找资料,在Data里有个错误日志,用notepad打开以后显示

Cannot open file  

F:\zhuanyesoftware\eclipseworkspace\JnaTest_NLPIR\Data\English.pdat
Cannot open file F:\zhuanyesoftware\eclipseworkspace\JnaTest_NLPIR\Data\KeyBlackList.pdat

我在我的Data里面找了找,诶,没这俩文件啊,后来才发现,我copy的Data是sample里的Data,而不是根目录下的Data.sample里是没有这两个的,又拷了一遍Data终于是解决了。


最后的成果,当当当当~


成功了,之后还会继续研究这个系统的用法,也希望各位大佬多多指教,小白也是会成长的!




  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值