Python词云生成
词云是什么
词云就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。
需要安装的库
pip install jieba / pip install imageio / pip install wordcloud
项目目录
实现
参考代码:
wordCloudDemo.py
import jieba as j
import wordcloud as wc
import imageio
with open('test2.txt', 'r', encoding='utf-8') as r: # 读取test2.txt中的文本作为词云源文本内容
txt = r.read()
text_cut = ' '.join(j.lcut(txt))
mask = imageio.imread('bg.png') # 背景形状图,设置mask参数,以该参数设置的图形生成词云形状 该图片需要透明背景的图形 mask默认为矩形
cloud = wc.WordCloud(background_color='black', font_path='msyh.ttc', max_font_size=200, width=1100, height=860, mask=mask) # max_font_size 最大文字大小 background_color 词云图背景颜色
cloud.generate(text_cut)
cloud.to_file('cloudDemo.png') # 保存为cloudDemo.jpg