hanlp 安装（python3.7版本）

最新推荐文章于 2024-08-08 08:10:37 发布

马行处

最新推荐文章于 2024-08-08 08:10:37 发布

阅读量2.9k

点赞数

文章标签：自然语言处理

本文链接：https://blog.csdn.net/qq_37928340/article/details/105367375

版权

必看官网：https://www.hankcs.com/nlp/hanlp.html

简介

HanLP是由一系列模型与算法组成的工具包，目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点；提供词法分析（中文分词、词性标注、命名实体识别）、句法分析、文本分类和情感分析等功能。

HanLP已经被广泛用于Lucene、Solr、ElasticSearch、Hadoop、Android、Resin等平台，有大量开源作者开发各种插件与拓展，并且被包装或移植到Python、C#、R、JavaScript等语言上去。基于深度学习的HanLP2.0已与2020年初发布，面向下一个十年的前沿NLP技术，与1.x相辅相成，平行发展。

pip install pyhanlp

# -*- coding:utf-8 -*-

from pyhanlp import *
text = "中文分词只是第一步；HanLP从中文分词开始，覆盖词性标注、" \
       "命名实体识别、句法分析、文本分类等常用任务，提供了丰富的API。" \
       "不同于一些简陋的分词类库，HanLP精心优化了内部数据结构和IO接口，" \
       "做到了毫秒级的冷启动、千万字符每秒的处理速度，而内存最低仅" \
       "需120MB。无论是移动设备还是大型集群，都能获得良好的体验。" \
       "不同于市面上的商业工具，HanLP提供训练模块，可以在用户的语" \
       "料上训练模型并替换默认模型，以适应不同的领域。项目主页上提" \
       "供了详细的文档，以及在一些开源语料上训练的模型。HanLP希望兼" \
       "顾学术界的精准与工业界的效率，在两者之间取一个平衡，真正将自" \
       "然语言处理普及到生产环境中去。"
phraseList = HanLP.extractPhrase(text, 3);
for line in phraseList:
    print(line)

然后就出现下面的