HanLP是由一系列模型与算法组成的工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点;提供词法分析(中文分词、词性标注、命名实体识别)、句法分析、文本分类和情感分析等功能。
参考了网上的好多资源写了此博文
如果你的pytorch版本和GPU是对应的兼容版本,重要提示不要直接pip install pyhanlp 或者pip install hanlp ,它会让你的pytorch自动更新升级。pytorch自动更新升级的还有torchtext。安装的时候需要注意。安装torchtext需要
conda install -c pytorch torchtext
(安装的时候观察一下,如果出现torch的更新,立马关掉命令)
下面我们开始安装hanlp,首先需要你电脑上配有Visual C++我的是
然后就是java中的JDK,一般电脑上安装过neo4j或者Navicat premium过的都会有JDK的插件(这3个软件我安装太久了,忘记了,大家自行搜搜吧)
打开cmd 先执行pip install jpype1(这里是jpype1有一个数字1)
测试jpype是否成功
>>> from jpype import *
>>> startJVM(getDefaultJVMPath(), "-ea")
>>> java.lang.System.out.println("月亮就是被人偷走的")
月亮就是被人偷走的
>>> shutdownJVM()
>>>
这是成功了,我的python是3.9的,在具体哪个网站找到这两个文件的我也忘记了,只记得找了好久(因为自己太菜了)现在分享给有需要的人,在我的主页里面的资源里面hanlp的压缩包。下载保存到你的文件夹,需要注意的就是hanlp文件夹里面的hanlp.properties的文件用记事本打开修改root,root=你保存此文件的路径。我的保存为D盘下的ok文件夹下HANLP的文件夹下了
修改之后,在pycharm里面运行测试
from jpype import *
startJVM(getDefaultJVMPath(), "-Djava.class.path=D:\ok\HANLP\hanlp\hanlp-1.8.3.jar;D:\ok\HANLP\hanlp",
"-Xms1g",
"-Xmx1g") # 启动JVM,Linux需替换分号;为冒号:
print("=" * 30 + "HanLP分词" + "=" * 30)
HanLP = JClass('com.hankcs.hanlp.HanLP')
# 中文分词
print(HanLP.segment('月球持续偷走地球的能量,渐渐对地球造成打击,地球将无四季之分'))
print("-" * 70)
shutdownJVM()
结果为
==============================HanLP分词==============================
[月球/n, 持续/vd, 偷走/v, 地球/ns, 的/ude1, 能量/n, ,/w, 渐渐/d, 对/p, 地球/ns, 造成/v, 打击/v, ,/w, 地球/ns, 将/d, 无/v, 四季/n, 之/uzhi, 分/qt]
----------------------------------------------------------------------
具体详细内容访问https://zhuanlan.zhihu.com/p/62766818?utm_source=wechat_session
这个就是可以完整下来hanlp的步骤,其他方法对于我来说都不行。
如有侵权,立即删除