HanLP安装与使用-python版和java版

HanLP是一个强大的NLP工具包,适用于Python和Java。本文介绍了如何安装和使用HanLP,包括Python版的安装、使用、报错及解决方法,以及Java版的安装、报错解决方案。在Python版中,提到了pyhanlp的安装路径问题,解决方法是更新data文件夹和修正hanlp.properties配置。在Java版中,通过jpype调用JVM,并解决了报错问题。
摘要由CSDN通过智能技术生成

HanLP是一系列模型与算法组成的NLP工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。内部算法经过工业界和学术界考验,配套书籍《自然语言处理入门》已经出版。

Java版:https://github.com/hankcs/HanLP
Python版:https://github.com/hankcs/pyhanlp

python版

1,安装:

pip install pyhanlp

(我的:)它会默认将pyhanlp安装在,C:\Users\ASUS\Anaconda3\Lib\site-packages\pyhanlp

2,使用:

$ hanlp segment
商品和服务

3,报错:

ValueError: 配置错误: 数据包 C:/Users/ASUS/Anaconda3/Lib/site-packages/pyhanlp/static\data 不存在,请修改配置文件中的root

参考资料:https://blog.csdn.net/Changxing_J/article/details/103641309

4,解决:

1.下载HanLP的data文件夹,data文件夹复制到报错信息路径的static文件夹中
下载地址:https://github.com/hankcs/HanLP
2.检查C:/Users/ASUS/Anaconda3/Lib/site-packages/pyhanlp/static中hanlp.properties文件的root变量值,发现路径无误
root=c:/users/asus/anaconda3/lib/site-packages/pyhanlp/static
执行以上两步操作后,运行仍然报错,经过进一步的检查,发现:
3.发现在root变量值后多出一个"\r",将这个额外的"\r"删去
再次重新尝试运行,不再报错可正常使用。

5,正确结果:
在这里插入图片描述

Java版

这里虽然安装了java版本,但使用却是用python调用jvm,再使用它的函数。
不过安装过程可以借鉴。

1,先安装 jpype
参考资料:Python – jpype JVM的第三方库使用
https://www.lfd.uci.edu/~gohlke/pythonlibs/下载,我选择python36,64位的。
在这里插入图片描述
下载,并找到对应位置后pip install xxx.whl

2,使用

from jpype import *

startJVM(getDefaultJVMPath(
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值