小白NLP入门,pyhanlp安装以及初步调试

pyhanlp的安装

在命令行中输入指令:

pip install pyhanlp

成功后可直接开始调试。

如果windows报错,多半需要安装Visual C++或者更轻量的Miniconda,报错时会同时提供下载地址,下载并安装。
输入指令:

conda install -c conda -forge jpype1
pip install pyhanlp

问题得解。

hanlp安装

命令行输入指令:

hanlp

坐等下载安装即可,下面是我安装完成后的信息:

usage: hanlp [-h] [-v] {segment,parse,serve,update} ...

HanLP: Han Language Processing v1.7.8

positional arguments:
  {segment,parse,serve,update}
                        which task to perform?
    segment             word segmentation
    parse               dependency parsing
    serve               start http server
    update              update jar and data of HanLP

optional arguments:
  -h, --help            show this help message and exit
  -v, --version         show installed versions of HanLP

命令行测试

输入指令:

hanlp segment

这是分词功能,接下来你只需要输入一段你想测试的语句即可

'接下来我给大家打一个五连鞭'

得到结果:

'/nx 接下来/vl 我/rr 给/p 大家/rr 打/v 一个/mq 五连/nz 鞭/ng '/nx

在pycharm中测试

输入代码:

from pyhanlp import *

初次运行会显示错误,在pyhanlp下按下A/T+Enter下载***data.zip***并等待其解压完成。
接下来是测试代码:

from pyhanlp import *

# 新闻摘自中国新闻网
document = "11月3日电 据中央气象台网站消息,受冷空气和“天鹅”的共同影响"\
		   "3日08时至4日08时,东海南部、台湾海峡、台湾以东洋面、巴士海峡、北部湾、南海大部、中沙群岛、"\
           "西沙群岛以及浙江沿海、福建沿海、广东沿海、海南岛东部沿海将有6-7级大风。"\
           "未来三天,受高原槽影响,青藏高原东部有雨雪天气,其中青海东南部和川西高原北部部分地区有中到大雪。"\
           "云南、西藏东南部等地有小到中雨,局地大雨。"

# 提取document的两个关键词
print(HanLP.extractKeyword(document, 2))

# 提取ducument中的3个关键句作为摘要
print(HanLP.extractSummary(document, 3))

得到结果:

[影响, 高原]
[受高原槽影响, 其中青海东南部和川西高原北部部分地区有中到大雪, 青藏高原东部有雨雪天气]

大家可以看到,得到的结果并不是很精准。对不同的语句进行分析会得到不同的结果,其精准度也有不同。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值