数据可视化,看这一篇就够了

数据可视化是洞察复杂数据的关键工具,从约翰·斯诺的霍乱地图到现代的交互式BI系统,其重要性不言而喻。可视化帮助决策者快速理解数据,但也需警惕不当可视化带来的误导。本文探讨了数据可视化的演变历程,从17世纪的图表萌芽到21世纪的可视分析学,以及如何选择合适的展现形式,遵循有效的可视化流程。
摘要由CSDN通过智能技术生成

引言

John Snow(不是G.O.T.里那个“私生子”)大概永远不会想到,自己在排查霍乱传播途径时,在地图上标记死于霍乱病人的“霍乱地图”居然会被后人评为历史上十佳数据可视化的案例,并且成为了医药地理学和传染病学中一项基本的研究方法。约翰·斯诺 (John Snow,1813年3月15日-1858年6月16日),英国内科医生,曾经当过维多利亚女王的私人医师,因在1854年宽街霍乱爆发事件研究中作出重大贡献,被认为是麻醉医学和公共卫生医学的开拓者。

https://www.results.org.au/john-snow-the-epidemiologist/

https://www.results.org.au/john-snow-the-epidemiologist/

在斯诺生活的年代,对霍乱的起因的主流意见是空气污染论(认为霍乱像黑死病一样通过空气传播)。另一方意见是未被广泛接受病菌学说。通过深入研究,在与当地居民的沟通中加上亨利·怀特海德的协助,斯诺判断出宽街的公共水泵是污染源,斯诺随后使用点示图去解释霍乱案例爆发点是以水泵为中心。通过连接霍乱事件与地理信息的关联,创制了著名的 “霍乱地图”[1]。

他将该地区的每一个水泵,以及四周的水井都标注到图中。最后他发现最多的霍乱患者围绕的水泵位于宽街。

新冠疫情肆虐期间,大家每天查看的疫情地图,都得感谢祖师爷斯诺的贡献。

回到本文的主题,关于数据可视化,数据玩家将按经典的Why-What-How逻辑为大家逐步展开。

一、为什么要数据可视化

——Necessity for data visualization

先来举个栗子,大家可以尝试找出下图中的“7”:

看累了?试试下面这张图呢?

是不是容易太多了,这就是视觉的力量

可视化辅助决策

研究表明,人眼是一个高带宽大量视觉信号并行GPU,带宽在2.339G/s,相当于一个两万兆网卡,具有超强的模式识别能力,且对可视符号的处理速度比数字或者文本快多个数量级,在大数据时代,数据可视化是人们洞察数据内涵、理解数据蕴藏价值的有力工具。

因此,可视化常常被用来辅助决策,如上图,中间的一张密密麻麻的客户表,到底能得出什么有价值的信息指导决策呢?光看一行行一列列的数据,可能需要很久才能得出一些结论,但是经过可视化,我们可以轻松的以各种形式的可视化快速掌握结论,从而辅助决策。

这就是:可视分析,即将信息提炼为知识,起到“观物至知”对作用,便于决策者从复杂、大量、多维度的数据中快速挖掘有效信息。

不当可视化误导判断

值得注意的是,并非所有的可视化都可以指导决策,甚至不当的可视化会误导判断,以致做出错误的决策。

• 2004年前后,美国有线通信协会(NCTA)发布的报告中,用下图声称美国政府的管制行为导致了企业投资下降,而在放开管制后,企业投资就大量增加。

• 乍看之下,管制的时候是左柱,投资只有140亿美元,放开管制后,投资有560亿美元貌似结论没有错误。但这张图有严重的误导与逻辑的纰漏

• 1996-1999年间三年的数据缺失。三年可以发生很多事情,在缺乏数据的情况下,强行将1999年后的投资增长归结于去管制,是有逻辑欠缺的。

• 左柱只总结了3年的总投资,右柱则总结了4年的总投资,这更是故意误导观众,让观众认为去管制后企业投资大大增加,而游说政府放开行业管制。实际上很可能是其他因素造成的快速增长,而不仅仅是去管制。

真相到底是什么?

可以看到,事实上96年放开管制后,随后的三年里企业投资并没有显

  • 4
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值