《七天数据可视化之旅》第三天:数据图表的选择(中)
Destiny,某物流公司数据产品经理,目前从事数据平台搭建和可视化相关的工作。持续学习中,期望与大家多多交流数据相关的技术和实际应用,共同成长。
0x00 前言
数据图表的选择(上),分享了「时序数据」和「比例数据」的可视化图表方案。
不同的数据类型、不同的阐述目的,决定了数据可视化展现形式的差异。因此,今天这篇文章,主要是分享两类不同的可视化目的及其可选择的图表形式。
「对比型数据」:
对比两组或两组以上数据的差异。
「分布型数据」:
研究数据分布的集中趋势、离散程度、偏态和峰度等。
0x01 对比型数据可视化
在实际工作中,我们经常需要对比多组数据之间的差异,而这些差异通常是通过不同的标记和视觉通道体现出来。
高度差异/宽度差异:
柱状图、条形图。
面积差异:
面积图、气泡图。
字号差异:
单词云图。
形状差异:
星状图。
1.柱状图
在《数据图表的选择(上)》有写到,柱状图是离散时间数据可视化的方式之一,只不过这里的系列值的数据类型是「时间」而已。
柱状图除了可以用于离散时间数据的可视化,更多的是用于比较不同分类数据的可视化,且柱状图的数据条数,最好不要超过12条。
以下根据数据类别的个数和可视化的目的,细化柱状图的图表选择:
单一柱状图:
适合单一类别的数据比对,也适合表示离散型时序数据的趋势。
重叠型柱状图:
适合两个类别的数据对比,半透明柱形条,代表某项指标的「目标值」,内部偏窄且不透明的柱形条表示某项指标的「实际完成情况」。
通常会搭配折线图使用,折线图则表示目标完成率。
并列柱状图:
适合两个或三个数据类别的对比,若数据类别超出3个,不建议使用并列柱状图。
堆叠柱状图:
适合既要对比总体的数据,又要对比总体各构成项的数据,但是总体各构成项一般不要大于5个,若大于5个,可按占总体的比例进行归类,展示TOP5的分类,剩下则归为「其他」。
2.条形图
条形图,可以视为是柱状图的一种变体,在大部分情况下,是可以互换的。那么在哪些情况下,条形图能比柱状图更好的展示数据呢?
条形图,相比柱状图而言,可以展示更多的数据条数,一般不要超过30条。
若分类项的文本过长时,柱状图的文本需要进行旋转才能不重叠,不利于阅读,而条形图就就没有这个缺点。