HanLP自定义词典(python版)
安装HanLP:pip install pyhanlp
!!!本人电脑python3.9不能直接安装(必须python3.8及以下版本才可直接pip)
首先创建虚拟环境:conda create -n Hanlp python==3.8
然后进入虚拟环境:activate HanLP
最后执行安装代码:pip install pyhanlp
自定义词典
自定义词典前分词效果
from pyhanlp import *
print(HanLP.segment('三傻子'))
开始添加自定义词典
- 找到data文件:C:\Users\dell.conda\envs\HanLP\Lib\site-packages\pyhanlp\static\data
- 进入custom(C:\Users\dell.conda\envs\HanLP\Lib\site-packages\pyhanlp\static\data\dictionary\custom)文件新建“我的词典.txt”
- 返回static文件(C:\Users\dell.conda\envs\HanLP\Lib\site-packages\pyhanlp\static)修改hanlp文件和hanlp.properties文件(修改方式相同)
- 返回custom(C:\Users\dell.conda\envs\HanLP\Lib\site-packages\pyhanlp\static\data\dictionary\custom)删除CustomDictionary.txt.bin文件
- 添加自定义词典完成,分词效果如下图所示。