HanLP是一系列模型与算法组成的NLP工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。内部算法经过工业界和学术界考验,配套书籍《自然语言处理入门》已经出版。
Java版:https://github.com/hankcs/HanLP
Python版:https://github.com/hankcs/pyhanlp
python版
1,安装:
pip install pyhanlp
(我的:)它会默认将pyhanlp安装在,C:\Users\ASUS\Anaconda3\Lib\site-packages\pyhanlp
2,使用:
$ hanlp segment
商品和服务
3,报错:
ValueError: 配置错误: 数据包 C:/Users/ASUS/Anaconda3/Lib/site-packages/pyhanlp/static\data 不存在,请修改配置文件中的root
参考资料:https://blog.csdn.net/Changxing_J/article/details/103641309
4,解决:
1.下载HanLP的data文件夹,data文件夹复制到报错信息路径的static文件夹中
下载地址:https://github.com/hankcs/HanLP
2.检查C:/Users/ASUS/Anaconda3/Lib/site-packages/pyhanlp/static中hanlp.properties文件的root变量值,发现路径无误
root=c:/users/asus/anaconda3/lib/site-packages/pyhanlp/static
执行以上两步操作后,运行仍然报错,经过进一步的检查,发现:
3.发现在root变量值后多出一个"\r",将这个额外的"\r"删去
再次重新尝试运行,不再报错可正常使用。
5,正确结果:
Java版
这里虽然安装了java版本,但使用却是用python调用jvm,再使用它的函数。
不过安装过程可以借鉴。
1,先安装 jpype
参考资料:Python – jpype JVM的第三方库使用
从https://www.lfd.uci.edu/~gohlke/pythonlibs/下载,我选择python36,64位的。
下载,并找到对应位置后pip install xxx.whl
2,使用
from jpype import *
startJVM(getDefaultJVMPath(