python 分词词性_pyhanlp——分词与词性标注

weixin_39786141

于 2020-12-09 20:07:02 发布

阅读量801

点赞数 1

文章标签： python 分词词性

本文介绍了如何使用Python接口PyHanLP进行分词和词性标注，PyHanLP是HanLP的Python版本，提供包括词法分析、句法分析等自然语言处理任务。文章给出了分词和词性标注的示例代码，并简单讲解了HanLP.segment的工作原理和可用的分词器。

摘要由CSDN通过智能技术生成

这篇文章的内容是作为所有文本分类技术的基础而写的，也可以把它作为其他自然语言处理技术的基础。pyhanlp的内容很多，这篇文章先介绍分词和词性标注这一部分。顺便写一个简介。

简介

pyhanlp是HanLP的Python接口。因此后续所有关于pyhanlp的文章中也会写成HanLP。HanLP是完全用Java自实现的自然语言处理工具包。特点是完全用Java实现不引入第三方工具包。完全开源。中文的开源工具能做到这么完整的大概只有HanLP。包括了词法分析、句法分析、分类、聚类、关键词抽取等常见NLP应用任务。并且github上问题回答快，作者很是认真的解决大家提出的问题。虽然用Java实现，HanLP也提供了Python接口。

简单的安装过程，请先确保安装了anaconda3

# 安装命令

$ pip install pyhanlp

# 更新到最新代码包和数据包

$ hanlp update

分词与词性标注

示例

In [1]: from pyhanlp import *

In [5]: print(HanLP.segment("你好，欢迎使用HanLP汉语处理包！接下来请从其他Demo中

...: 体验HanLP丰富的功能~"))

[你好/vl, ，/w, 欢迎/v, 使用/v, HanLP/nx, 汉语/gi, 处理/vn, 包/v, ！/w, 接下来/vl, 请/v, 从/p, 其他/rzv, Demo/nx, 中/f, 体验/v, HanLP/nx, 丰富/a, 的/ude1, 功能/n, ~/nx]

In [11]: for word in word_li:

...: print(word.word, word.nature)

...:

你好 vl<

最低0.47元/天解锁文章

weixin_39786141

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python 分词词性_pyhanlp——分词与词性标注

这篇文章的内容是作为所有文本分类技术的基础而写的，也可以把它作为其他自然语言处理技术的基础。pyhanlp的内容很多，这篇文章先介绍分词和词性标注这一部分。顺便写一个简介。简介pyhanlp是HanLP的Python接口。因此后续所有关于pyhanlp的文章中也会写成HanLP。HanLP是完全用Java自实现的自然语言处理工具包。特点是完全用Java实现不引入第三方工具包。完全开源。中文的开源工...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。