常用的数据可视化工具
一、美颜工具类
这类数据可视化工具的特点是:网页轻服务,轻巧易上手,高度风格化。
工具 | 特点 | 网址 |
---|---|---|
Inforgram | 应用场景精准,图表动画功能是亮点 | https://infograom.com/ |
Piktochart | 多用于地图功能免费 | https://pitocharc.com/ |
Venngage | 模板超多场景超多,还免费 | https://infograph.venngage.com |
Plotly | 支持3D图表 | https://plot.ly/ |
Datawrapper | 专注图表,地图支持Geojason格式,可做多种地图可视化 | https://app.datawrapper.del/ |
百度图说 | 中文支持、含有echarts代码 | https://tushuo.baidu.com/ |
Canvas | 有国际版和中文版,模板众多 | https://www.cacwa.cnc. |
二、专业图表类
这类图表工具的特点是:软件体量大,自由度中等,产出价值高。
工具 | 特点 | 用途 |
---|---|---|
Excel | 广泛使用,好上手 | 个人/公司 |
Tabulea | 商业分析必备,好上手,图表美观 | 个人/公司 |
PowerBi | Excel的衍生产品,语言类似excel公式,其中的powermap地理功能强大 | 个人/公司 |
BDP | 在线商业智能,有一些独特的酷炫图表 | 个人/公司 |
DataV | 可结合业务部署的可视化产品,以大屏为卖点 | 个人/公司 |
网易有数 | 为企业级大数据分析量身打造,可私有化部署的敏捷BI | 公司 |
Datamap | 集合数据仓库、数据分析、地理分析,数据可视化于一体的数据平台 | 公司 |
Raydata | 酷炫数据交互可视化系统,拥有强大数据集成图形化能力 | 公司 |
三、代码装逼类
这类工具的特点是让数据调参更自由,让数据处理量激增,让数据玩法更多样。
工具 | 特点 | 语言 |
---|---|---|
echarts | 高度封装的可视化图表,案例清晰美观丰富 | JavaScnipt |
D3 | 代码偏底层,基于SVG绘制图形,做数据可现化需要从图形做起,更自由,所以也更难 | JavaScnipt |
Highcharts | 类似echarts, echarts自由度高, 数据量大时适用 | JavaScnipt |
P5/Processing | 针对设计师等非编程开发的语言工具,有丰富的模拟自然成果,可联动硬件 | JavaScnipt |
google charts | 类似highcharts, google官方出品的js工具库 | JavaScnipt |
Polymaps | 针对地图可视化的工具库 | JavaScnipt |
Ploty/Dash | 有网页工具,也有单体图表,还有仪表盘的工具库 | Python |
Geoplotlib | 几款酷炫的地图可视化组成的工具库 | Python |
pyechars | 使用python调用echarts的工具库 | Python |
matplotlib | python基础可视化工具库 | Python |
Seabom | 基于matplotib的高级可视化效果库 | Python |
Bokeh | 交互性python可视化工具库 | Python |
ggplot2 | 定义各种底层组件来合成复杂的图形,以非常简洁的函数构建图表 | R |
plot3D | 可绘制3D可视化图表 | R |
常见的数据可视化图形
一,关联(相关)
关联图表用于可视化2个或更多变量之间的关系。也就是说,一个变量如何相对于另一个变化。
1、散点图
- 散点图是用于研究两个变量之间关系的经典的和基本的图表。如果数据中有多个组,则可能需要以不同颜色可视化每个组。
2、带边界的气泡图
- 在边界内显示一组点以强调其重要性
3、带线性回归最佳拟合线的散点图(最佳拟合线性回归线的散点图)
- 可了解两个变量如何相互改变,显示数据中各组之间最佳拟合线的差异。
4、抖动图
- 通常,多个数据点具有完全相同的X和Y值,导致多个点绘制会重叠并隐藏。为避免这种情况,可将数据点稍微抖动,以便直观地看到它们
5、计数图
- 避免点重叠问题的另一个选择是增加点的大小,这取决于该点中有多少点。因此,点的大小越大,其周围的点的集中度越高。
6、边缘直方图
- 边缘直方图具有沿X和Y轴变量的直方图。这用于可视化X和Y之间的关系以及单独的X和Y的单变量分布。这种图经常用于探索性数据分析
7、边缘箱形图
- 边缘箱图与边缘直方图具有相似的用途。然而,箱线图有助于精确定位X和Y的中位数,第25和第75百分位数
8、相关图
- 相关图用于直观地查看给定数据框(或二维数组)中所有可能的数值变量对之间的相关度量。
9、矩阵图
- 矩阵图是探索性分析中的最爱,用于理解所有可能的数值变量对之间的关系。它是双变量分析的必备工具。
二,偏差(偏差)
10、发散型条形图
- 想根据单个指标查看项目的变化情况,并且可视化此差异的顺序和数量,那么散型条形图是一个很好的工具。它有助于快速区分数据中组的性能,并且非常直观,并且可以立即传达这一点。
11、发散型文本
- 发散型文本与发散型条形图相似,如果你想以一种漂亮和可呈现的方式显示图表中每个项目的价值,就可以使用这种方法。
12、发散型包点图
- 发散型包点图也类似于发散型条形图。然而,与发散型条形图相比,条的缺失减少了组之间的对比度和差异。
13、带标记的发散型棒棒糖图
- 带标记的棒棒糖图通过强调您想要引起注意的任何重要数据点并在图表中适当地给出推理,提供了一种对差异进行可视化的灵活方式。
14、面积图
- 通过对轴和线之间的区域进行着色,面积图不仅强调峰和谷,而且还强调高点和低点的持续时间。高点持续时间越长,线下面积越大。
三,排序(排名)
15、有序条形图(订购条形图)
- 有序条形图有效地传达了项目的排名顺序。但是,在图表上方添加度量标准的值,用户可以从图表本身获取精确信息。
16、棒棒糖图(棒棒糖图)
- 棒棒糖图表以一种视觉上令人愉悦的方式提供与有序条形图类似的目的。
17、包点图(Dot Plot)
- 包点图表传达了项目的排名顺序,并且由于它沿水平轴对齐,因此您可以更容易地看到点彼此之间的距离。
18、坡度图(斜率图)
- 坡度图最适合比较给定人/项目的“前”和“后”位置。
19、哑铃图
- 哑铃图表传达了各种项目的“前”和“后”位置以及项目的等级排序。如果您想要将特定项目/计划对不同对象的影响可视化,那么它非常有用。
四,分布(经销)
20、连续变量的直方图
- 直方图显示给定变量的频率分布。
21、类型变量的直方图
- 类型变量的直方图显示该变量的频率分布。通过对条形图进行着色,可以将分布与表示颜色的另一个类型变量相关联。
22、密度图
- 密度图是一种常用工具,用于可视化连续变量的分布。通过“响应”变量对它们进行分组,您可以检查X和Y之间的关系。以下情况用于表示目的,以描述城市里程的分布如何随着汽缸数的变化而变化。
23、直方密度线图
- 带有直方图的密度曲线汇集了两个图所传达的集体信息,因此您可以将它们放在一个图中而不是两个图中。
24、Joy Plot
- Joy Plot允许不同组的密度曲线重叠,这是一种可视化大量分组数据的彼此关系分布的好方法。 它看起来很悦目,并清楚地传达了正确的信息。
25、分布式包点图
- 分布式包点图显示按组分割的点的单变量分布。 点数越暗,该区域的数据点集中度越高。 通过对中位数进行不同着色,组的真实定位立即变得明显。
26、箱形图(Box Plot)
- 箱形图是一种可视化分布的好方法,记住中位数、第25个第45个四分位数和异常值。 但是,您需要注意解释可能会扭曲该组中包含的点数的框的大小。 因此,手动提供每个框中的观察数量可以帮助克服这个缺点。
27、包点+箱形图(Dot + Box Plot)
- 包点+箱形图 (Dot + Box Plot)传达类似于分组的箱形图信息。 此外,这些点可以了解每组中有多少数据点。
28、小提琴图(小提琴情节)
- 小提琴图是箱形图在视觉上令人愉悦的替代品。 小提琴的形状或面积取决于它所持有的观察次数。 但是,小提琴图可能更难以阅读,并且在专业设置中不常用。
29、人口金字塔
- 人口金字塔可用于显示由数量排序的组的分布。 或者它也可以用于显示人口的逐级过滤,因为它在下面用于显示有多少人通过营销渠道的每个阶段。
30、分类图
- 可用于可视化彼此相关的2个或更多分类变量的计数分布。
五,组成(组成)
31、华夫饼图
32、饼图
33、树形图
34、条形图
六,变化(更改)
35、时间序列图
- 时间序列图用于显示给定度量随时间变化的方式。
36、带波峰波谷标记的时序图(带峰值和低谷的时间序列注释)
- 时间序列绘制了所有峰值和低谷,并注释了所选特殊事件的发生。
37、自相关和部分自相关图
- 自相关图(ACF图)显示时间序列与其自身滞后的相关性。 每条垂直线(在自相关图上)表示系列与滞后0之间的滞后之间的相关性。
38、交叉相关图(Cross Correlation plot)
- 交叉相关图显示了两个时间序列相互之间的滞后。
39、时间序列分解图(时间序列分解图)
- 时间序列分解图显示时间序列分解为趋势,季节和残差分量。
40、多个时间序列(多个时间序列)
- 可以绘制多个时间序列,在同一图表上测量相同的值
41、使用辅助Y轴来绘制不同范围的图形(使用辅助Y轴绘制不同比例)
- 如果要显示在同一时间点测量两个不同数量的两个时间序列,则可以在右侧的辅助Y轴上再绘制第二个系列。
42、带有误差带的时间序列(带误差带的时间序列)
- 如果有一个时间序列数据集,每个时间点(日期/时间戳)有多个观测值,则可以构建带有误差带的时间序列。
43、堆积面积图
- 堆积面积图可以直观地显示多个时间序列的贡献程度,因此很容易相互比较。
44、未堆积的面积图
- 未堆积面积图用于可视化两个或更多个系列相对于彼此的进度(起伏)
45、日历热力图
- 与时间序列相比,日历地图是可视化基于时间的数据的备选和不太优选的选项。 虽然可以在视觉上吸引人,但数值并不十分明显。 然而,它可以很好地描绘极端值和假日效果。
46季节图(季节性情节)
- 季节图可用于比较上一季中同一天(年/月/周等)的时间序列。
七,分组(团体)
47树状图
- 树形图基于给定的距离度量将相似的点组合在一起,并基于点的相似性将它们组织在树状链接中
48簇状图(Cluster Plot)
- 簇状图可用于划分属于同一群集的点。
49安德鲁斯曲线(Andrews Curve)
- 安德鲁斯曲线有助于可视化是否存在基于给定分组的数字特征的固有分组。 如果要素(数据集中的列)无法区分组,那么这些线将不会很好地隔离
50平行坐标
- 平行坐标有助于可视化特征是否有助于有效地隔离组。 如果实现隔离,则该特征可能在预测该组时非常有用。
参考网址:http://liyangbit.com/pythonvisualization/matplotlib-top-50-visualizations/
https://blog.csdn.net/Tw6cy6uKyDea86Z/article/details/86535412