常用基础图表的使用场景解析
前言
图表,是数据可视化项目中最常见、最基础的元素,而在不同的数据结构下选择不同的图表,就会产生不同的效果,它的选择和使用,往往是制作可视化数据分析图表最重要的一步。合适地选择图表,不仅能够更加清晰明了地呈现数据之间的态势和逻辑,同时在也更加符合人体视觉感官的体验。
(声明:以下数据纯属虚构并无实际意义)
1、表格(多维度多指标)
表格是最传统的数据展现方式,它所承载的信息多而密集,可以同时分析多维度、多指标数据,适合对数据敏感的人群使用。虽然表格能看到具体的数值,但是不能直观看到趋势、比重。
例图1(简单表):
例图2(交叉表):
使用表格时需要记住一点,要让设计融入背景,让数据占据核心地位,不要让厚重的边框和阴影与数据争夺用户的注意力。 相反,使用窄边框或者干脆去掉边框,来突出数据。
2、柱状图(类别比较)
柱状图是使用频率最高的图表,甚至没有之一,使用场景又能被分成以下几个:
数据视图:
适用场景(各个类别做对比):
1.反映时间趋势,与折线图比较的话,柱状图更能体现出每一个数据的
细节部分;
2.同个时间下,不同类目/类别数据的比较,反映出类别之间的差异;
3.数据不会很多的情况下,例如2~8个序列的时候,如果要比较,可以
优先使用“柱状图”,超过这个序列的时候,选择折线图,或者动态图表
每次只展示一部分数据;
4.同项目多时间段,使用“簇状柱形图“。
优点:人眼对高度较敏感,直观各组数据差异性,强调个体与个体之间的比较。
局限:分类过多则无法展示数据特点。
总结:
2~8个序列,需要比较的时候使用柱状图;
需求:
1.请绘制2014年六大一线城市的营收对比图(单位:百亿)
2.请绘制2018~2019年六大一线城市的营收对比图(单位:百亿)
柱状图主要配置:
网格线、系列重叠、间隙宽度、数据标签
例图1:
例图2:
维度:2 度量:1+
3、条形图(类别比较)
与柱状图对应的就是条形图,如果比较一组或多组数据、优先观察数据的分布、类别名称比较长等,优先使用条形图,展示效果会比柱状图要好不少。文字从左到右理解,结构与人们阅读习惯比较相似,容易阅读。
数据视图:
适用场景(各个类别做对比):
1.同一事物在不同时间的变化优先使用条形图,其次才是柱状图
2.用数量来观察各种信息大小的时候使用条形图;
3.类别名称比较长的时候优先使用条形图而不是柱状图,这样能让类别
名称完整显示出来;
4.多项目多时间,使用“簇状条形图“;
5.不能排序的项目优先使用“条形图”然后才是“柱状图。
局限:分类过多则无法展示数据特点。
总结:
同一事物不同时间,观察数据分布,类别名称比较长的时候使用条形图
跟直方图类似,适用于频率统计。
需求:
1.请绘制“学猫叫”的热度分布图
2.请绘制网易云七大神曲“9/10月”热度分布图
条形图主要配置:
网格线、系列重叠、间隙宽度、数据标签、逆序类别
例图1:
例图2:
维度:0 度量:1
4、饼图/圆环图(占比分析)
如果是要统计数据的占比情况,那么就选择饼图,或者是圆环图,这个系列的图表能很清晰地展示数据的占比情况,当两个数据大小差不多时,难以察觉。
数据视图:
适用场景(占比分析情况):
展示数据分布,需要统计占比分析的情况,数据不用转换成百分比,直接使用原始数据即可
优点: 直观显示各项占总体的占比,分布情况,强调整体与个体间的比较。
局限:分类过多,则扇形越小,无法展现图表。
需求:
请绘制“2019年6大手机出货量占比图”,参考“例图1”,并且将
iPhone xs"系列扇形分离;
注意:
1.数据系列一般在1~8个,超过8个,饼图会变得非常拥挤,数据差异不
很大的情况下可以使用饼图/圆环图
2.数据差异较大的时候,除非为了突出,要不然可以使用“条形图“来实
现对比;
3.饼图尽量不要分离太多扇区,分离扇区起到突出重点的作用,分离过多
则无意义;
4.圆环图不要分离任何扇区,因为突出意义不大,圆环图一般用于仪表盘
的数据显示,在后面的误程中会讲解到。
饼图/圆环图主要配置:
图例、数据标签
例图1:
例图2:
维度:1 度量:1
5、散点图(双变量分析)
散点图能直观精确反映数据之间的相关性,一般在回归分析会用到,最常见的是用于分析数据之间的关联,有以下几种联系:
适用场景(XY双变量分析):
XY两个变量之间的关联与联系,例如:身高/体重、广告投放/收入等等,如果需要分析变量之间的关系,则使用散点图。
优缺点:
1.可以用于展示数据的分布和聚合的情况;
2.适合展示比较大的数据;
3.看上去比较乱,数据细节不明显,只能看到相关、分布、聚合等信息。
例图1:
例图2:
例图3:
维度:0+,作为颜色 度量:2
6、气泡图(三变量分析)
在散点图的基础上,如果数据的维度增加多一维,那么就可以使用气泡图,气泡图的性质与散点图接近,但是不适合展示大量数据,一般也可以用来观察少量数据的分布情况。
数据视图:
适用场景(XZ三变量分析):
XYZ三个变量之间的关联与联系,例如:身高/体重/年龄、广告投放/收入/转换比等等,如果需要分析三变量之间的关系,则使用气泡图
优点: 直观反映数据集中情况,对离散数据线性回归等曲线预测性的拟合辅助作用
局限:数据量小的时候会比较混乱。
需求:
请绘制“身高-体重-年龄”相关气泡图,并分析“气泡图”与“散点图
的差异;
注意:
1.如果数据差异极大,那么可以考虑将气泡进行一定的缩放,让数据看起来不会这么夸张
2.气泡图不适合大量数据,大量数据会让气泡图丧失意义,数据尽量在1~8个左右,与柱状图、条形图相似;
3.气泡图也不能展示细节,只能用来简单观察分析数据,一般在数据汇报
处代替表格。
气泡图主要配置:
网格线、敔据标签、坐标轴标題、气泡大小、大小表示、水平坐标轴刻度线、负数气泡为“白色异常值
例图1:
与散点图一样,也可以绘制多组数据系列。
例图2:
维度:1+,作为颜色 度量:3,其中1个是气 泡大小
7、雷达图(多属性分析)
如果数据的维度暴增,变成了4~10维的话,那么要对比他们的差异,使用雷达图是最佳的,但是雷达图有一个限制,就是数据量不能很大,并且尽量让数据归一化进行对比(同数据量对比),否则会丧失意义。
数据视图:
适用场景(同对象或者多对象多属性分析):
1.雷达图适用于多维数据(四维以上),并且每个维度可以排序的场景,
数据系列一般在1~3个左右,太多的话很难辨别。
2.用来了解各项指标变动情况以及好坏分析。
3.数据可排序。
局限:分类过多或变量过多,会比较混乱。
需求:
请绘制“学员A/B十大水平能力测试”雷达图,并且分析“雷达图”与
条形图”在使用上的一些异同
注意:
1.数据系列一般在1~3个左右,超过的话,辨别会有难度;
2.维度一般在10维以下,太多的话,雷达图就像一个圆,辨别也会有难度;
3.使用雷达图的数据,必须支持排序,如果不能排序就没有意义,因为不能排序的数据并不属于同一类可对比数据,例如月份作为维度。
雷达图主要配置:
网格线、Y轴坐标轴线条
例图1:
例图2:
除了以上的注意事项之外,雷达图由于是全部连接在一起的,这就要求数据之间没有什么关联,并且可排序,如下就是错误示范:
错误示例:
维度:1+ 度量:1+
8、折线图(趋势分析)
如果数据量比较大,并且数据是沿着某个方向进行有规律变化的,那么就可以使用折线图,它用线条将相关数据连接起来,能直观看出随着x轴变化,y轴是怎样的变化趋势。
数据视图:
数据量较大不便展示,请直接例图。
适用场景(反应整体的趋势):
观察一个或者多个数据指标连续变化的趋势
根据需要与之前的周期进行同比数据分析
反应数据在一个有序的变量上的变化,可以清晰展示数据的增减趋势
增减的速率、增减的规律、峰值等等。
需求:
1.请绘制“东京/伦敦平均气温”变化趋势图
2.请绘制余额宝2013~2018年收益率变化的趋势
注意:
在每张图表中不能一次展示太多折线图,否则数据会非常混乱,折线图
的数量在1~3条即可
优点:
1.能很好展示数据沿某个维度的变化趋势
2.能比较多组数据在同个维度上的趋势;
3.与散点图一致,适合展示大量数据,如果数据量大,选择不带标记,数
据量少,选择带标记的折线图。
局限:无序的类别无法展示数据特点。
折线图主要配置:
网格线、Y轴坐标轴线条
少量数据反应数据细节和趋势:
数据量大的时候,可以看出整体的趋势,例如下图余额宝七日年化收益率的变化:
维度:1+,可对比
度量:1+
时间维度:X轴
9、面积图(趋势分析)
面积图是折线图的变种。 面积图更注重数据类别之间随着时间趋势的变化关系。
适用场景:面积图除了可以像折线图一样表达变化趋势,还可以通过层叠的阴影面积反映差距变化。
优点:颜色的填充可以更好的突出趋势信息。
相似图表:
· 数据监控面积图:用于显示每个数值所占大小随时间或类别变化的趋势线,展示的是部分与整体的关系。比如服务器CPU、内存等监控场景。
· 横向面积图:用横向面积来展示趋势信息。只是与竖向面积图的不同展现样式。
10、组合图(不同数量级)
更新于2019年12月10日,未完待续。。。