1、jieba 包安装anaconda环境下: pip install jieba
2、jieba基本操作:
jieba.cut()——接收三个参数,需要分词的字符串,
3、自定义词典补充:
- jieba.load_userdict(file_name)#自定义词典的路径
- 词典格式和dict.txt一样,一词占一行,每一行三部分,词语词频词性,用空格隔开
4、jieba.add_word(''),jieba.del_word('')
备注:配合counter使用
from collections import Counter