在开始编写程序之前,我们先了解一下词云图的作用,我们拿到一篇文章,想得到一些关键词,但文章篇幅很大,无法短时间得到关键词,这时我们可以通过程序将文章中的每个词组识别出来,统计每个词组出现的次数,出现次数越多,字号越大,最后吧所有词组拼成一张图,这就是词云图了。
现在开始写程序
import jieba
import wordcloud
import imageio
首先,我们导入 jieba,wordcloud库,这2个库是第三方库,需要自己安装,imageio是python自带库不需要安装
安装方法:
pip install jieba
pip install wordcloud
Ps:因为我用的是Windows系统,所以这里只有Windows系统安装方法,其他系统需要读者去网上自寻
第二步
我们打开需要制作词云图的文件
with open('F:/三国..txt',encoding='utf-8') as f:
t=f.read()
下面我们将文章中的词组提出来
ls=jieba.lcut(t)
txt=" ".join(ls)
我们现在已经把所有词组提取出来,以空格分开,并保存在txt中
下一步,我们需要定义一个词云
w=wordcloud.WordCloud(width=2000,
height=1400,
font_path="msyh.ttc")