图表有很多,你用对了么?

        想必大家基本上都听过"文不如字,字不如表"的说法,也基本上能认可图表的重要性,但是就“如何选择一个合适的图表“可能仍有疑惑。

1.常见的错误场景

        下面是一张“10月各城市销售数据”的图表,该图的目的是想要对比各城市的销量数量,但是这样参差不齐的排列,很难让人一眼对比出差异,尤其是广州武汉长沙这几个城市的数据,很难比较。

        因此,我们制作图表前,可以先将数据按照数据大小顺序进行排列,这样制作出来的图表更合乎逻辑,更能直观地引导读者了解数据。一般情况下我们也会标注上对应的标签值,以便读者更好的理解。

        下面这张“各区域市场份额占比”的图表中,图表目的是想要对比两个不同年份的”各区域市场份额占比“情况,但是饼图不能直接、准确地看出各个分类项目的变化趋势及其幅度。读者需要反复对比两个饼图之间的差异。且正常情况我们对于饼图的阅读习惯是从12点钟方向顺时针开始的,所以,在制作饼图时,要调整最大的扇形从12点钟方向开始,并尽量按照面积从大到小进行排列,这样不仅方便别人阅读图表,更有利于清晰地呈现数据。

        针对上图的两个时间点的”各区域市场份额占比“情况,一般为了更好的让读者看出差异,可以使用堆积百分比图。通过下图能较为准确地看出最底层和最上面的数据系列是增加还是减少。

2.如何避免错误使用图表

        数据专家 Andrew Abela 曾整理过一份图表类型选择指南。通过将图表展示的数据关系分为四类:比较、分布、构成和联系,并根据这个分类和数据的状况给出了对应的图表类型建议。基本上确定好数据的关系类型后,就可以按照下图的分类找到对应的图表类型建议。

  • 联系关系-散点图

        散点图一般用于拟合因变量随自变量的变化趋势,在实验数据分析场景中使用较多。一般建议将拟合曲线或者趋势线显性展示,偏于读者更轻松的理解。

  • 联系关系-气泡图

        气泡图在商业分析报告中较为常见,如下图"埃森哲信息技术行业报告"的使用。气泡图相比较散点图,增加了第三维度,并通过图形的大小进行第三维度的数据展示。

  • 构成关系-饼图

注意:饼图是一种应该避免使用的图表,因为肉眼对面积大小不敏感。是最容易被误用的。但在具体反映某个比重的时候,配上具体数值,会有较好的效果。

在需要描述某一部分占总体的百分比时,适合使用饼图。例如:占据公司全部资金一半的两个渠道;某公司员工的男女比例等。

而需要比较数据时,尤其是比较两个以上整体的成分时,请务必使用条形图或柱形图,切勿要求读者将扇形转换成数据在饼图间相互比较,因为人的肉眼对面积大小不敏感,会导致对数据的误读。如章节1中所描述的错误场景。

另外,为了使饼图发挥最大作用,在使用中一般不宜超过6个部分,如需要表达6个以上的部分,也请使用条形图,扇形边个数过多,会导致饼图分块的意义解释过于困难。

  • 构成关系-堆叠柱状图

        堆叠柱状图不仅可以直观的看出每个系列的值,还能够反映出系列的总和,尤其是当需要看某一单位的综合以及各系列值的比重时,比如:2001-2009年A/B产品交易量(万)

  • 比较关系-曲线图

        曲线图,又称折线图。一般用来反映随时间变化的趋势。当我们需要描述事物随时间维度的变化时常常需要使用该图形。

注意:折线图中尽量避免使用虚线进行点和点之间的连接,虚线容易分散注意力。

  • 比较关系-雷达图

        雷达图适用于多维数据(四维以上),且每个维度必须可以排序。数据点一般6个左右,太多的话辨别起来有困难。常见的雷达图的应用场景有综合能力模型对比,人格分析等。

  • 比较关系-柱状图

        柱形图能够比较清晰的反映数据的差异,一般情况下用来反映分类项目之间的比较,也可以用来反映时间趋势。

注意:柱形图的局限在于它仅适用于中小规模的数据集,当数据较多时就不易分辨。一般而言,不要超过10个。

通常来说,柱形图的横轴是时间维度,用户习惯性认为存在时间趋势。如果遇到横轴不是时间维度的情况,建议用颜色区分每根柱子。

  • 分布关系 -直方图

        直方图(Histogram),又称质量分布图,是一种统计报告图,由一系列高度不等的纵向条纹表示数据分布的情况。 一般用横轴表示数据类型,纵轴表示分布情况。

注意:直方图和柱状图是不一样的。直方图一般用来描述等距数据或等比数据;柱形图一般用来描述称名数据或顺序数据。直观上,直方图矩形之间是衔接在一起的,表示数据间的数学关系;柱形图则留有空隙,表示仅作为两个或多个不同的类,而不具有数学相关性质。

3.常见问题及误区(转载)

Q: 柱形图和条形图都可以表示分类比较,那两者在使用上有何差异呢?

A: 当所比较项目的标签文本比较长时,柱形图的横轴下的标签会出现重叠或者倾斜,且占用空间大,影响读者的目光移动。所以在表示分类时,如项目数量较少,使用柱形图或条形图均可,如项目数量较多,则建议使用条形图。

Q: 柱形图和曲线图都可以表示时间序列的趋势,如何在两者之间选择?

A: 一般来说,建议用曲线图表示趋势。整体而言,柱形图更适合变现离散型的时间序列,曲线图更适合表现连续型的时间序列。当数据点较少时可以使用柱形图,数据点较多时建议使用曲线图。

Q: 面积图和曲线图都可以表示时间序列的趋势,两者之间如何选择?

A:当只展示一个度量数据的趋势时,两者完全等价,都可以使用,通常使用曲线图更多。

但是,当在大型会议室展示数据时,即读者离图表可能较远的情况,使用面积图能让后排的人看的更清楚。当比较多个度量数据的趋势时,建议使用曲线图。如使用面积图,则存在数据序列之间相互遮挡的情况,除了靠近横轴的那个数据序列外,很难观察出其他数据序列的变化趋势。

Q: 是不是应该避免使用饼图,能不用就不用?

A:从精确比较数据的角度来说,条形图的确更易于比较数据点之间的差异,但每种图表都有它的长处和适用场景,饼图能给我们一种整体和构成的印象,适用于表达“占比”——看到饼图就让想起100%,这个特点是条形图所没有的。

但是要尽量避免并列使用两个及以上的饼图,虽然这种用法很常见。

Q: 误区-凡出现数字的内容必用图表

A: 数据分析人员容易养成一个思维习惯,就是凡是数字比用图表。在数据差异极小的情况下,柱形图几乎为一条直线的时候,图表的作用并不明显,倒不如使用排序的数字表格更合适。

Q: 误区-夸张的图表压缩比例

A:数据分析人员可能存在因展示页面大小不够而自行缩短图表尺寸的情况。在此场景下一定要注意保证图示区域各图表之间的伸缩比一致,避免出现同一波动趋势,感观上完全不一样的情况。一般而言,建议绘图区的高度比例约为1:1左右,对角线约为45度左右,并且图表之间保持一致,以反映客观性和一致性。

4. 参考文章

  Andrew,2009,Advanced Presentations by Designs

 《Excel 图表之道》刘万祥著

  部分图片来源自 EasyCharts    

如觉得文章还对胃口,欢迎关注公众号“好奇分析”,更多有关数据分析的原创精彩内容每周更新。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值