1、简介
词云是一种数据呈现方式
不会的时候,感觉很厉害、很高大上
会用了之后,感觉到哪都看到别人在用
掌握用Python实现词云的方法
2、准备
安装包
pip install wordcloud matplotlib jieba PIL
准备一些文本,英文或中文皆可,以《西游记》为例。
3、编写代码
from wordcloud import WordCloud, ImageColorGenerator
from PIL import Image
import numpy as np
import matplotlib.pyplot as plt
import jieba.analyse
# 打开文本
text = open('../xyj.txt',encoding='utf-8').read()
# 提取关键词和权重
freq = jieba.analyse.extract_tags(text, topK=200, withWeight=True)
print(freq[:20])
freq = {i[0]: i[1] for i in freq}
# 生成对象
mask = np.array(Image.open("../color_mask.png"))
wc = WordCloud(mask=mask, font_path='C:/Windows/Fonts/simhei.ttf', mode='RGBA', background_color=None).generate_from_frequencies(freq)
# 从图片中生成颜色
image_colors = ImageColorGenerator(mask)
wc.recolor(color_func=image_colors)
# 显示词云
plt.imshow(wc, interpolation='bilinear')
plt.axis("off")
plt.show()
# 保存到文件
wc.to_file('wordcloud.png')
4、运行结果