![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Hanlp
qjy82
这个作者很懒,什么都没留下…
展开
-
字典树
字符串集合常用字典树存储,这是一种字符串上的树形数据结构。字典树中每条边都对应一个字,从根节点往下的路径构成一个个字符串。字典树并不直接在节点上存储字符串,而是将词语视作根节点到某节点之间的一条路径,并在终点节点上做个标记“该节点对应词语的结尾”。字符串就是一条路径,要查询一个单词,只需要顺着这条路径从根节点往下走。如果能走到特殊标记的节点,则说明该字符串在集合中,否则说明不存在。字典树的节点实...原创 2019-12-20 10:27:34 · 59 阅读 · 0 评论 -
切分算法
HanLP词典的加载&切分算法词典加载from pyhanlp import *def load_dictionary(): """ 加载HanLP中的mini词库 :return: 一个set形式的词库 """ IOUtil = JClass('com.hankcs.hanlp.corpus.io.IOUtil') path = Ha...原创 2019-12-08 11:25:58 · 609 阅读 · 0 评论 -
Hanlp配置
hanlp的安装首先在命令提示符中输入pip install pyhanlp然后提示如下错误:building‘_jpype’extensionerror:Microsoft Visual C++ 14.0 is required. 表面看是需要下载VC++,但实际上是通过下载JDK才能解决问题(Hanlp主项目是采用Java开发的)JDK下载了JDK 8. 然后配置环境变量。具体步骤...原创 2019-12-08 09:42:04 · 311 阅读 · 0 评论