使用HanLP分词时,标注词性经常出错,尤其见于人名译名的错误。
比如将“海尔”识别为人名,标注了nrf词性。
但是我们想把“海尔”识别为品牌名字,就需要修改nrf.txt文件。
修改词典后要删除对应的二进制文件,如nrf.txt.trie.dat文件。
重新Build项目,Run。
以及各种其他的词性标注错误,一般都是冲突,查看被标记成的词性,在用户字典中搜索删除,或者替换,或者另外加载自定义字典。
注意路径。
使用HanLP分词时,标注词性经常出错,尤其见于人名译名的错误。
比如将“海尔”识别为人名,标注了nrf词性。
但是我们想把“海尔”识别为品牌名字,就需要修改nrf.txt文件。
修改词典后要删除对应的二进制文件,如nrf.txt.trie.dat文件。
重新Build项目,Run。
以及各种其他的词性标注错误,一般都是冲突,查看被标记成的词性,在用户字典中搜索删除,或者替换,或者另外加载自定义字典。
注意路径。