“词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的冲突,形成“关键词云层”或“关键词渲染”。词云如图所示:
“词云”这个概念由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登(Rich Gordon)提出。
词云图过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。
下面主要来介绍一下词云生成的过程。顺便一提的是,现在也有很多在线的网站是可以直接生成词云的,只要把文字贴进去就可以了。但是,由于为了更好的明白词云的制作方法,所以还是通过python来处理。
1 安装python第三方库
安装方式:
win+R
输入cmd
pip install jieba
pip install wordcloud
2 生成词云代码
#practicer:宗明import jiebafrom PIL import Imagefrom wordcloud import WordCloud, STOPWORDSfrom imageio import imreadimport matplotlib.pyplot as pltcontent=open(r'F:\Python project\python大数据基础\Wordcloud.txt',encoding='utf8') #词云存放地址URLmylist = list(content)word_list = [" ".join(jieba.cut(sentence)) for sentence in mylist]new_text = ' '.join(word_list)pac_mask = imread("ap.png") #词云所需图片wc = WordCloud(font_path='simhei.ttf',background_color="white",max_words=2000,mask=pac_mask).generate(new_text)plt.imshow(wc)plt.axis('off')plt.show()wc.to_file('F:\Python project\python大数据基础\ok.png') #输出图片位置
效果图如最上面所示
reference:
《python基础设计与实战》
编者仿写