词云”这个概念由美国西北大学新闻学副教授、新媒体专业主任里奇·戈登(Rich Gordon)于提出。
“词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。
import numpy as np
import matplotlib.pyplot as plt
from wordcloud import WordCloud
from PIL import Image
import os
from os import path
absPath=os.getcwd()
print(absPath)
filePath=path.join(absPath,'data/st.txt')
info=open(filePath).read() #读取文本内容
#获得图片
imgFilePath=path.join(absPath,'data/stormtrooper_mask.png')
stormtrooper=np.array(Image.open(imgFilePath))
print(stormtrooper)
wc=WordCloud(background_color='white',max_font_size=40,max_words=500,mask=stormtrooper).generate(info)#词云的分析
# 步骤4-2:设置图片
plt.imshow(wc, interpolation="bilinear")
# 步骤4-3:取消图表x、y轴
plt.axis("off")
# 步骤3-3:保存成图片文件
wc.to_file(path.join(absPath, "data/alice_wordcloud.png"))
# 显示图片
plt.show()