Python中分分词工具很多,在这里选用的分词工具jieba分词,分词需要用到两个包,如下:
1、jieba:是结巴分词工具
2、wordcloud:是词云
** 选用朱自清的散文《春》进行词云分析,代码入下:**
**-*- coding: utf-8 -*-**
'''
分别导入了画图的库,词云生成库和jieba的分词库
''
import jieba
import matplotlib.pyplot as plt
from wordcloud import WordCloud
#打开本体TXT文件
text=open("chun.txt").read()
#使用jieba进行分词,并对分词的结果以空格隔开,cut_all=True 设置为全模式
wlist=jieba.cut(text,cut_all=True)
#使用空格连接
mylist=" ".join(wlist)
#对分词后的文本生成词云
mylistt=WordCloud().generate(mylist)
#显示词云图
plt.imshow(mylistt)
#是否显示x轴、y轴下标
plt.axis("off")
plt.show()
运行结果如下:
如果