jieba是Python中一个重要的第三方中文分词函数库,由于是第三方库,不是安装包自带,需要通过pip指令安装。
![指令](https://i-blog.csdnimg.cn/blog_migrate/d3c58f421765e91ead202040cc9a3a69.png)
jieba库的解析
![解析](https://i-blog.csdnimg.cn/blog_migrate/7ad3c27256242208466c3eb22aaa7b44.png)
利用jieba库进行文本词频统计
《三国演义》人物出场统计
import jieba
txt = open("三国演义.txt", "r", encoding='utf-8').read()
words = jieba.lcut(txt)
counts = {
}
for word in words:
if len(word) == 1:
continue
else:
counts[word] = counts.get(