Python数据可视化:WordCloud入门
WordCloud是一种很好的展现数据的方式,网上也有不少小工具和在线网页。但是有些不支持中文,有些安装复杂,所以决定用Python实现。主要参考官网,通过官网的例子,讲一下WordCloud的制作。
WordCloud是一种很好的展现数据的方式,网上也有不少小工具和在线网页。
但是有些不支持中文,有些安装复杂,所以决定用Python实现。
主要参考官网,通过官网的例子,讲一下WordCloud的制作。
主要流程
- 获取内容的路径
- 如果是一段文字,系统自动算频次
- 你也可以直接导入统计好的频次
- 设置字体
- 一般字体路径在C:\Windows\Fonts,你可以选自己喜欢的中文或者英文字体
- 切割中文字符
- 英文字符就不用切割了
- 输入WordCloud的参数
- 背景色
- 字号
- 生成的形状
- 颜色
- 字体大小
- 字体旋转等等
- 生成WordCloud
- 用matplotlib显示图片
效果图
安装库
老规矩,首先,你要安装库。
最基本的两个:
1. pip install wordcloud #这是WordCloud的库
3. pip install matplotlib #显示图像
一个单词构造WordCloud
在这个代码中,我们需要安装一个numpy库
(大部分小伙伴应该都装过,就不用再装了)
1. pip install numpy
这里用这个库,主要是想用数学坐标生成一个简单的背景图案,比如圆形、方形
基本步骤
- 输入单词
- 用numpy 生成一个形状,下面生成了一个圆形mask
- 输入WordCloud的参数(包括背景色、是否重复、图案形状)
- 用matplotlib显示图片
1. import numpy as np
2. import matplotlib.pyplot as plt
3. from wordcloud import WordCloud
4. text = "square" #输入你要的单词
5. x, y = np.ogrid\[:300, :300\] #快速产生一对数组
6. # 产生一个以(150,150)为圆心,半径为130的圆形mask
7. mask = (x - 150) \*\* 2 + (y - 150) \*\* 2 >