前几天在琢磨对文本进行词频统计,后来一想,用词云来对文本进行分析岂不更好玩儿,说干就干!
1)准备工作:
预先在电脑上安装好 jieba库、wordcloud库、imageio库,以及目标文本,还可以实现准备一张图片,这样词云可以按照事先准备的图片的样子来显示。
2)实验代码:
import jieba
import wordcloud
from imageio import imread
mk=imread("C:\\Users\\dell\\Desktop\\002.jpg") #事先准备好的图片作为词云展示的样式
f=open("C:\\Users\\dell\\Desktop\\三国演义.txt","r",encoding="utf-8") #打开要进行词云展示的文本
t=f.read()
f.close()
ls=jieba.lcut(t) #对文本进行分词
txt=" ".join(ls) #由于词云操作需要词与词之间以空格来分隔,所以用join()方法来对文本进行处理
w=wordcloud.WordCloud(font_path="msyh.ttc",mask=mk,\
width=1000,height=700,background_color="white",\
) #设置词云的字体,需要词云展示的样式,词云图片的宽和高,以及图片背景颜色
w.generate(txt)
w.to_file("C:\\Users\\dell\\Desktop\\006.png") #最终词云的存放路径