hanlp简介:
HanLP是由一系列模型与算法组成的Java工具包,目标是普及自然
语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构
清晰、语料时新、可自定义的特点。
功能:中文分词 词性标注 命名实体识别 依存句法分析 关键词提取
新词发现 短语提取 自动摘要 文本分类 拼音简繁
hanlp环境安装(mac)
hanlp是java写的开源库,在python环境中调用hanlp需要java环境的支持和python调用java的工具
- 安装java
- 安装Jpype
JPype是一个能够让 python 代码方便地调用 Java 代码的工具,从而克服了 python 在某些领域(如服务器端编程)中的不足。
pip install jpype1
import jpype
print(jpype.__version__)
0.7.0
执行如下代码测试:
import jpype
print(jpype.__version__)
if __name__=="__main__":
# 获取系统的jvm路径
jvm_path = jpype.getDefaultJVMPath()
print(jvm_path)
# 设置jvm路径,以启动java虚拟机
jpype.startJVM(jvm_path,convertStrings=False)
# 执行java代码
jpype.java.lang.System.out.println('hello world')
# 关闭jvm虚拟机,当使用完 JVM 后,可以通过 jpype.shutdownJVM() 来关闭 JVM,该函数没有输入参数。当 python 程序退出时,JVM 会自动关闭。
jpype.shutdownJVM()
/Library/Java/JavaVirtualMachines/jdk1.8.0_211.jdk/Contents/Home/jre/lib/jli/libjli.dylib
hello world
接下来配置hanlp 安装
1、下载hanlp.jar包: https://github.com/hankcs/HanLP
2、下载data.zip:https://github.com/hankcs/HanLP/releases中http://hanlp.linrunsoft.com/release/data-for-1.7.0.zip后解压数据包。
3、配置文件 示例配置文件:hanlp.properties配置文件的作用是告诉HanLP数据包的位置,只需修改第一行:root=usr/home/HanLP/ 比如data目录是/Users/hankcs/Documents/data,那么root=/Users/hankcs/Documents/
也可以从我的百度网盘下载。
配置的路径参考:https://objc.com/article/17
window 下使用参考:https://blog.csdn.net/HHTNAN/article/details/81908451
参考链接:
可参考的官网链接
https://github.com/hankcs/HanLP
http://hanlp.com