本文是整理了部分网友在配置hanlp自定义词典时遇到的一小部分问题,同时针对这些问题,也提供另外一些解决的方案以及思路。这里分享给你们学习参考。java
要使用hanlp加载自定义词典能够经过修改配置文件hanlp.properties来实现。学习
要注意的点是:编码
1.root根路径的配置:orm
hanlp.properties中配置以下:input
#本配置文件中的路径的根目录,根目录+其余路径=完整路径(支持相对路径)string
#Windows用户请注意,路径分隔符统一使用/it
root=D:/Project/public_sentiment_monitor/plugin/hanlp1.6.8/io
2.自定义词典路径的配置,配置文件中已经指明了相应的用法。配置
hanlp.properties中配置以下:plugin
#自定义词典路径,用;隔开多个自定义词典,空格开头表示在同一个目录,使用“文件名 词性”形式则表示这个词典的词性默认是该词性。优先级递减。
#全部词典统一使用UTF-8编码,每一行表明一个单词,格式听从[单词] [词性A] [A的频次] [词性B] [B的频次] ... 若是不填词性则表示采用词典的默认词性。
CustomDictionaryPath=data/dictionary/custom/hanlp_custom.txt; 搜狗金融词库.txt n; CustomDictionary.txt; 现代汉语补充词库.txt; 全国地名大全.txt ns; 人名词典.txt
3.配置文件作好之后,自定义词典不起做用问题
(1). 须要先删除custom文件夹下的全部bin文件,而后再使用hanlp,hanl