目录
图表类型选择的依据
数据可视化图表类型选择,总结下来,需要考虑三点:
- 需要从已有数据出发,考虑想要用数据图表做什么,也就是图表的功能性。比如我要查看公司产品的用户中的各年龄段的占比,如果可分成5个年龄段,那用饼图就比较合适。
- 还要考虑图表对使用者的理解能力要求,也就是可理解性。刚才的例子说到饼图,饼图对于任何人都是比较浅显易懂的,那就不存在问题,如果比较复杂的图形比如桑基图,就要考虑使用人是谁,有没有可能这个图使用人无法理解。
- 然后要考虑图表的可读性,用刚才的例子,5个年龄段,用饼图比较合理,如果是15个年龄段,当然也能用饼图去表现,但是可读性会降低一些,占比1%以下的部分就无法进行比较了。
图表的功能性总结
可视化图表所具有的功能有很多,比如柱状图,通过不同类别的柱长,来代表每一类别数值大小,可起到不同类别之间做比较的功能。有些图表具有多种功能。
比较:显示值与值之间的不同和相似之处。通常使用图形长度、面积、颜色来比较不同分类间数值的大小,也有用宽度、位置、角度等。比如最常见的柱状图,就具有比较的功能。
分布:显示频率,数据分散在一个区间或分组。使用图形的位置、大小、颜色的渐变程度来表现数据的分布,通常用于展示连续数据上数值的分布情况。比如散点图、气泡图等,可以查看、分析数据的分布。
流程:显示流程流转和流程流量。一般流程都会呈现出多个环节,每个环节之间会有相应的流量关系。比如漏斗图,具有流程分析的功能。
占比:可显示同一维度上占比关系。比如饼图,有展示占比的作用。
关联:显示数据之间相互关系。 使用图形的嵌套和位置表示数据之间的关系,通常用于表示数据之间的前后顺序、父子关系以及相关性。比如韦恩图,有展示数据之间关系的作用
趋势:分析数据的变化趋势。使用图形的位置表现出数据在连续区域上的分布,通常展示数据在连续区域上的大小变化的规律。比如折线图,可展示数据随时间变化的趋势
地图:显示地理区域上的数据。使用地图作为背景,通过图形的位置来表现数据的地理位置,通常来展示数据在不同地理区域上的分布情况。比如气泡地图,可展示地图上每个区域的连续数据的大小。
图表类型总结
下面每个功能类型内的具体图表顺序,是按照我理解的最常见到不常见排序的。
比较类
柱状图和柱状图变体
下图是横向柱状图的示例,展示了某年各省份的GDP。
柱状图的基本类型有横向和纵向(也称“条形图”)。演化出的进阶类型有:堆叠柱状图、双向柱状图、分组柱状图、玉玦图(环形柱状图)、南丁格尔玫瑰图。
横向柱状图和纵向柱状图的一大区别在于:横向柱状图可以容纳更多分类。一般来说,横向柱状图适合于少于30个分类,纵向柱状图适合于少于12个分类。下面是横向柱状图的一个例子。
基本的柱状图不多解释了,这里看下其他分类。
堆叠柱状图
下图是堆叠柱状图的一个示例,每种化妆品在各个城市的销售情况。
适合用于二级分类的数据,要展示每个一级分类内部的二级分类的数值。可以形象得展示一个大分类包含的每个小分类的数据,以及各个小分类的占比,显示的是单个项目与整体之间的关系。下面是一个纵向堆叠柱状图的例子。
横向堆叠柱状图和纵向堆叠柱状图的区别也是在于适宜展示的分类数量,上限分别是30和12。
还有一种特殊的堆叠柱状图是展示百分比的堆叠柱状图:柱子的各个层代表的是该类别数据占该分组总体数据的百分比,关注点在百分比而不在具体数量。
下图表是一个游戏公司在不同年份的各类游戏的销量情况。
双向柱状图
下图是双向柱状图的示例。展示了某个公司各个部门对某项任务的完成情况数据的对比,完成人数使用正向柱状图表示、未完成人数使用反向柱状图表示。
双向柱状图(又称“正负条形图”),使用正向和反向的柱子显示类别之间的数值比较。可用来比较两个事物或两个分类的多项数据,比如两个城市、两个公司、及格同学和不及格同学等。双向柱状图基本可以用雷达图替换,可以说在适用范围上,雷达图>双向柱状图。后面再说雷达图。
分组柱状图
下图是分组柱状图的示例,对比了某游戏公司在 2001、2002、2003 这三年的各类游戏的销量情况
分组柱状图大致功能和堆叠柱状图相同,只是堆叠柱状图更方便看到各一级分类的总量,分组柱状图更强调二级分类之间的对比。
玉玦图(环形柱状图)
下图是玉玦图的示例,反应了美国民众对不同领域中的中美问题关注程度。
其实就是柱状图的直接变形,只是审美上占优势,有一个严重缺陷是:具有半径反馈效应。视觉上半径越大的玦环会看起来更大,半径小的则小,所以要使用且不想造成视觉误差就必须要先进行数量排序,但是如果分类本身是带有顺序的