11-数据可视化应该避免的误区

11-数据可视化应该避免的误区

关于数据可视化概念的讨论文章很多,但为了高大上,多少都写得有点“专业、绕口”。

我这样的草根认为,在学习、使用数据可视化前,都应该先问问:要可视化的是什么?

数据可视化,简单地说就是用图表表达具有下述要素的信息:

  • 你从数据中理解到的、
  • 你认为有价值的、
  • 使用图形化手段能更清晰地表达和交流的。

首先,你要通过图形表达的信息,应该是你从数据中理解到的。

这里有两个关键点:这个信息必须是来源于数据中,并且应该是你理解的。信息必须起源于数据,不管是数据的直接表达,还是数据经过聚合、拟合、…等分析后得到的,但这些信息必须起源于数据。同时应该是你从数据中理解到的,如果你都没有或不能理解要表达的信息,就不可能准确地用图形表达,因为你根本就不知道表达的结果是否正确。最忌讳的,就是绘制了一个酷炫的图形,自己都说不清要表达什么!

绘图完成后,请试着说出你在图形中表达的信息。

其次,要表达的信息至少在你看来是很有价值的。

费了九牛二虎之力,绘制的图形表达的信息与你论文、书籍的主题无关,与你或客户的业务无关,这样的可视化也就失去了价值。

最后,使用图形化手段能更清晰地表达和交流。

有些信息,数据本身就能非常好地、直接地表达出来,非得弄一个图表,实在没有必要。

但是有相当一部分数据可视化的实践或多或少的偏离了可视化的最初目标,陷入一些常见的误区不能自拔:

误区一:追求形式主义,丢弃了数据灵魂

因为过于追求图表的外观,忘记了你在数据中发现的有价值的信息才是图表的灵魂这个道理。

随着前端技术的发展,图表在外观上越来越精美,交互、动画、3D展示效果都能很轻松地渲染出来。但问题就出在这里。太过于专注图表的外观效果,反而牺牲,甚至丢弃了数据的灵魂。

在群中,有一位网友问了一个这样的问题:

11-数据可视化应该避免的误区

他先展示了一张这样的条形图

紧接着问:

11-数据可视化应该避免的误区

他可能是想让图形看起来漂亮一些。

**但是,**如果让条形的四角都变成圆角,会形成误导:每个类别在偏向两边类别时,总量变小了。实际上,条形图数据是不可能有这样的信息的。

事实上,上面的条形图有一件非常重要的事要做:先将数据排序,让条形按序呈现出来。

再举一例(前面谈过,这里从另一个角度看):

有人问:如何把下图y轴设置为不是科学计数法。

11-数据可视化应该避免的误区

有位热心人帮他改过来了,他又接着问:

11-数据可视化应该避免的误区

有一个明白人告诉他:如果从0开始,那么几个柱状图的高差将不明显。

在这个例子中,他应该考虑的是如何调整参数,以便提醒读者,最左边还有一个年度,而不是那个条一点都看不到。

误区二:自己都没有理解数据,传达了错误的信息

有很多可视化库和包,集成了较强的统计绘图功能。如R的ggplot2,Python的Semborn等。

有些人自己不对数据做分析,依赖于这些库的便捷功能,直接绘制统计图形,我是非常不赞成的。数据可视化表达的应该是你从数据中理解到的有价值信息,依托库、包的自动统计得到的信息价值大大降低,有时甚至是错误的信息。

误区三:数据展现层次不分明,让人不得要领

有些数据可视化,罗列了一大堆数据和指标,恨不得在张图上把所有的数据和信息都展示出来,结果反而变成一团乱麻,就算设计再美观,读者也难以获取信息。记住:“主次分明,突出中心思想”这样的叙述原则同样适用于可视化。不要试图展现所有的东西,只要给出最关键的信息。

你从不同角度对数据的理解应该展现在不同的图表中。

误区四:选择了错误图表类型,或者错误的表达

每种图表类型都有自己适合表达方向,比如条形图适合表达类别之间问题的差异,饼图适合表达占比,线型图适合表达趋势,散点图适合表达分布。

如果要用散点图表达分布的趋势最好就要加上趋势线。

如果你要用条形图,记住一个原则:排序有助于展示类别之间的差异。

总结

草根总结的,数据可视化的四个原则:

  1. 数据中或明或隐藏的信息比图表的外观重要。
  2. 有价值的信息才值得可视化。
  3. 应该是你理解数据,而不是可视化工具。
  4. 突出主题。

序幕有点长,准备工作已做好,学习matplotlib的正剧即将开始。

从下一篇开始将使用“matplotlib学习笔记”系列。

我们一起摆脱落坑的痛苦,开启快乐、通透的matplotlib之旅。

(This end.)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Python草堂

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值