一、什么是词云图?
词云图是一种用来展现高频关键词的可视化表达,通过文字、色彩、图形的搭配,产生有冲击力地视觉效果,而且能够传达有价值的信息。
制作词云图的网站有很多,简单方便,适合小批量操作。
BI软件如Tableau、PowerBI也可以做,当然相比较web网站复杂一点。
在编程方面,JavaScript是制作词云图的第一选择,像D3、echarts都非常优秀。
python也有不少可视化库能制作词云图,这次我们尝试使用pyecharts。
先上效果图:
二、pyecharts介绍
pyecharts是基于echarts的python库,能够绘制多种交互式图表。
这次使用的pyecharts版本是1.7.1,python版本是3.6。
pyecharts提供了多种个性化配置方案,可以按需选择。
# 系列名称,用于 tooltip 的显示,legend 的图例筛选。
series_name: str,
# 系列数据项,[(word1, count1), (word2, count2)]
data_pair: Sequence,
# 词云图轮廓,有 'circle', 'cardioid', 'diamond', 'triangle-forward', 'triangle', 'pentagon', 'star' 可选
shape: str = "circle",
# 自定义的图片(目前支持 jpg, jpeg, png, ico 的格式,其他的图片格式待测试)
# 该参数支持:
# 1、 base64 (需要补充 data 头);
# 2、本地文件路径(相对或者绝对路径都可以)
# 注:如果使用了 mask_image 之后第一次渲染会出现空白的