mac版本:10.15.4
python: 3.6
hanlp环境安装
hanlp是java写的开源库,在python环境中调用hanlp需要java环境的支持和python调用java的工具
- 安装java
- 安装Jpype
JPype是一个能够让 python 代码方便地调用 Java 代码的工具,从而克服了 python 在某些领域(如服务器端编程)中的不足。
pip install jpype1
- 测试
import jpype
jpype.startJVM()
# 执行java代码
jpype.java.lang.System.out.println('hello world')
# 关闭jvm虚拟机,当使用完 JVM 后,可以通过 jpype.shutdownJVM() 来关闭 JVM,该函数没有输入参数。当 python 程序退出时,JVM 会自动关闭。
jpype.shutdownJVM()
能够正常打印“hello word”则证明安装成功
hanlp 安装
- 下载hanlp.jar包 密码: sdf8
- 下载data.zip 密码: s3h7
下载完成后,将data.zip和hanlp-1.7.8-release.zip解压,并将解压后hanlp-1.7.8-release目录下的所有文件和的data放在同一个目录下,这里我新建一个hanlp的目录用于存放这些文件的
- 配置文件
hanlp的配置文件是hanlp.properties,配置文件的作用是告诉HanLP数据包的位置,只需修改第一行: root=/User/opt/hanlp/ 即data文件的绝对路径.
我的目录如下:
- 测试
test_hanlp.py中内容如下:
from jpype import *
import os
jarpath = os.path.join(os.path.abspath('.'), 'hanlp-1.7.8.jar')
dependency = os.path.abspath('.')
# 注意: -Djava.class.path= 在Linux和mac下 jarpath和dependency需替换分号;为冒号:
startJVM(getDefaultJVMPath(),
"-Djava.class.path="+jarpath+":"+dependency,
"-Xms1g",
"-Xmx1g")
HanLP = JClass('com.hankcs.hanlp.HanLP')
print(HanLP.segment('你好,欢迎在Python中调用HanLP的API'))
打印结果:
[你好/vl, ,/w, 欢迎/v, 在/p, Python/nx, 中/f, 调用/v, HanLP/nx, 的/ude1, API/nx]
安装完成!!!