Python如何使用HanNLP工具

最新推荐文章于 2023-11-13 19:29:23 发布

年少无为呀！

最新推荐文章于 2023-11-13 19:29:23 发布

阅读量1.7k

点赞数

分类专栏： NLP自然语言处理文章标签： python pycharm 开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_19409845/article/details/127880396

版权

NLP自然语言处理专栏收录该内容

9 篇文章 0 订阅

订阅专栏

Python如何使用HanNLP工具

目录

目录

目标：使用pycharm调用HanNLP工具完成对文本的分词、自动摘要、关键词提取等任务。

系统安装配置 JDK 1.8

1、windows环境下载 JDK 1.8
2、安装 JDK 1.8
在这里插入图片描述

3、配置环境变量

在这里插入图片描述
变量名：JAVA_HOME

变量值：C:\Program Files\Java\jdk1.8.0_101

在这里插入图片描述

双击Path，编辑Path环境变量，

点击新建，添加“%JAVA_HOME%\bin”

再次点击新建，添加“%JAVA_HOME%\jre\bin”

在这里插入图片描述

新建环境变量CLASSPATH

变量名：CLASSPATH

变量值：.;%JAVA_HOME%\lib\dt.jar;%JAVA_HOME%\lib\tools.jar

需要注意变量值前面的“.;”

在这里插入图片描述

4、测试 JDK是否安装成功

win+r运行cmd
在这里插入图片描述

执行有结果表示配置成功
命令：java
在这里插入图片描述

命令： javac
在这里插入图片描述

系统安装 Visual C++ 2015

安装详看 : https://jingyan.baidu.com/article/e73e26c088e45424acb6a759.html

下载 HanNLP 包

1、下载hanlp.jar包解压 : https://github.com/hankcs/HanLP
在这里插入图片描述

2、下载data.zip: https://github.com/hankcs/HanLP/releases中 http://hanlp.linrunsoft.com/release/data-for-1.7.0.zip 后解压数据包

在这里插入图片描述

最终将data与hannlp解压的jar包统一放在一个目录下【之前不在一个目录报错】

在这里插入图片描述

测试HanNLP工具

from jpype import *

startJVM(getDefaultJVMPath(), "-Djava.class.path=hanlp-1.8.3.jar")

# 加载java中模型
HanLP = JClass('com.hankcs.hanlp.HanLP')
NLPTokenizer = JClass('com.hankcs.hanlp.tokenizer.NLPTokenizer')

# 目标据句
document = "徐先生还具体帮助他确定了把画雄鹰、松鼠和麻雀作为主攻目标。"
# 分词与词性标注
seg_list = HanLP.segment("你好，欢迎在Python中调用HanLP的API")
print(seg_list)

# 关键词提取
print(HanLP.extractKeyword(document, 20))

# 自动摘要
print(HanLP.extractSummary(document, int(len(document)/3)))

# 依存句法分析
print(HanLP.parseDependency(document))

# 命名实体识别与词性标注
print(NLPTokenizer.segment(document))


shutdownJVM()

年少无为呀！

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
Python如何使用HanNLP工具

使用pycharm调用HanNLP工具完成对文本的分词、自动摘要、关键词提取等任务
复制链接

扫一扫

专栏目录

年少无为呀！ CSDN认证博客专家 CSDN认证企业博客

码龄10年

46: 原创

8万+: 周排名

228万+: 总排名

6万+: 访问

: 等级

859: 积分

11: 粉丝

58: 获赞

15: 评论

181: 收藏

私信

关注

热门文章

分类专栏

最新评论

如何在linux系统下使用百度云盘上传下载文件？
Bing_Song_1234V5: Downloading https://mirrors.cloud.tencent.com/pypi/packages/b5/ae/04f39c5d0d0def03247c2893d6f2b83c136bf3320a2154d7b8858f2ba72d/multiprocess-0.70.16.tar.gz (1.8MB) 100% |████████████████████████████████| 1.8MB 506kB/s Complete output from command python setup.py egg_info: Traceback (most recent call last): File "<string>", line 1, in <module> File "/tmp/pip-build-J486MW/multiprocess/setup.py", line 21, in <module> raise ValueError(unsupported) ValueError: Versions of Python before 3.8 are not supported ---------------------------------------- Command "python setup.py egg_info" failed with error code 1 in /tmp/pip-build-J486MW/multiprocess/ You are using pip version 8.1.2, however version 24.0 is available. You should consider upgrading via the 'pip install --upgrade pip' command. 请问如何解决？
安装moviepy后ImageMagick报错问题解决！
qq_27715225: 可以了，感谢！
安装moviepy后ImageMagick报错问题解决！
杯莫停lne: 感谢博主，卡了一下午终于解决了！！
windows10/11子系统安装ubuntu22.04
年少无为呀！: 我这也没找到哈，可以看看官方教程或者在商店直接搜索ubuntu安装下试试呢
windows10/11子系统安装ubuntu22.04
ZJQ2016: 为找见wsl.rootfs.tar.gz

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

年少无为呀！ 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。