直观理解政策文件
需求:对于政府工作报告等政策文件如何直观理解
体会直观的价值:生成词云&优化词云
政府工作报告等文件----有效展示的词云
基本思路:
步骤1:读取文件,分词整理
步骤2:设置并输出词云
步骤3:观察结果,优化迭代
实现步骤一的代码如下所示:
import wordcloud import jieba f=open("新时代中国特色社会主义关于实施乡村振兴战略.txt","r",encoding="utf-8") t=f.read() f.close() ls=jieba.lcut(t) #分词结果保存为列表类型 txt=" ".join(ls) w=wordcloud.WordCloud(font_path="msyh.ttc",width=1000,height=700,background_color="white",max_words=15)#字体设置为微软雅黑,通过font_path来进行设置,而且通过max_words=15体现出在词云中最多显示15个单词,限制文字输出的数量 w.generate(txt) w.to_file("政府工作报告词云初始.png")# to_file方法生成词云文件。
运行界面如图:
通过词云,我们可知这篇文章所体现的内容为发展农业,振兴战略,还有农村农民,体现了文章的重要的地方。
之后,我们可以设置更有形的词云:
利用mask参数,通过覆盖的方法,可以生成任意形状的词云,例如边框为白色的五角星图片。
代码示例如下:
import wordcloud
import imageio
import jieba
mk=imageio.imread("五角星.jpg") #imread方法,能够读取一个图片文件并且变成一个图片文件表达的内部变量。
f=open("新时代中国特色社会主义关于实施乡村振兴战略.txt","r",encoding="utf-8")
t=f.read()
f.close()
ls=jieba.lcut(t)
txt=" ".join(ls)
w=wordcloud.WordCloud(font_path="msyh.ttc",width=1000,height=700,background_color="white",max_words=15,mask=mk)
w.generate(txt)
w.to_file("政府工作报告词云后端.png")
运行界面如下所示:
举一反三:
扩展能力:
了解wordcloud更多参数,扩展词云能力。
特色词云:设计一款属于自己的特色词云风格
更多文件:用更多文件练习词云生成