Python绘制词汇云
词汇云,由词汇组成类似云的彩色图形,用于展示大量文本数据。通常用于描述网站上的关键字元数据(标签),或可视化自由格式文本。 每个词的重要性以字体大小或颜色显示。“词云”就是对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。
1.准备工作
- 词汇云的背景图片,被分析词汇的文档
- Python库: wordcolud文字云词库
Jieba 中文分词库
Numpy 数据处理库
Matplotlib 数据绘制
PIL 图片处理库
2.代码实现
导入库
import wordcloud #词汇云库
from wordcloud import STOPWORDS # 停止词
import jieba
import numpy as np # 科学计算
import matplotlib # 数据可视化
from matplotlib import pyplot