一、数据可视化是什么?
此处,引用信息可视化概念的提出者斯图尔特·卡德(StuartK.Card)的理解与定义,他认为理解可视化首先需要区分以下两个概念。
- 感知(Perception)是对感觉信息(Sensory Information)的 组织、辨识 以及解释以便帮助人们理解周围的环境
- 认知(Cognition) 是一组心理过程,这个过程包括倾注注意力, 记忆,产生和理解语言,解决问题及作出决定
通过上述概念,我们不难看出,感知更多是解释、帮助人们理解周围的环境,它停留在认识的层面;而认知除了包括固有的感知外,还囊括解决方案、做出决定的动作,它不仅提倡认识、还要基于认识进行动作!
通过上述概念辨析,我们不难发现数据可视化是基于认知的。而斯图尔特·卡德(StuartK.Card)基于这个观点,提出了数据可视化的定义,即Visualization is really about external cognition, that is, how resources outside the mind can be used to boost the cognitive capabilities of the mind. 可视化是一个帮助人们对外部信息进行认知的过程,也就是说,是一个使用大脑以外的视觉资源与信号,来帮助增强大脑认知能力的过程。
二、什么是好的可视化?
第一部分中,我们理解了数据可视化的概念,那么怎样的数据可视化作品才算是好作品呢?好作品的衡量标准又是什么呢?
其实,一个好的可视化作品需要做到的就是,在最短的时间内,用最少的空间、最少的笔墨为受众提供最多的信息内涵(当然以上目标的前提,即数据处理过程中没有失真、扭曲)。
如何保证数据的处理没有失真、扭曲,这一系列操作内容和注意事项,笔者已经在“这篇文章把数据讲透了”系列文章中阐述过了,这里就不再赘述(有需要,可以通过文章尾部的往期文章链接前往查看!)
三、数据可视化的基本原则——信
上一个部分,我们已经介绍了一个好的数据可视化作品应该有怎样的品格,那么我们应该秉持怎样的原则,去塑造和打磨一个优秀的数据可视化作品呢?今天,我们先阐述第一个数据可视化的基本原则——信(剩下2个原则,请期待下期文章)。
数据可视化第一基本原则——信,即能正确的表达数据中的信息而不产生偏差和歧义。换句话说,“信”原则就是要求数据可视化设计能够正确表达信息的可视化,而信原则又由3个部分组成。
第一,控制谎言因子于合适范围
有朋友可能还不太懂这是什么意思?下面我举一个简单的例子吧。其实,我们生活中,有很多眼见不为实的案例,像下图所示,第一眼看去,你是不是认为上图的都是盘根交错的”曲线”?但其实,它们都是直线,只不过摆放位置有一些小技巧。
而要做到信,首先我们需要控制可视化图表中的谎言因子(Lie Factor),下面先阐述一下谎言因子的概念与提出。
谎言因子的概念由德国慕尼黑工业大学Rüdiger Westermann教授提出,是用来衡量可视化中所表达的数据量与数据之间的夸张程度的度量方法,其计算公式如下:
- 当LF=1时,我们认为图表没有对数据实时进行扭曲,是一个可信的可视化设计
- 在实际当中,应当确保各部分图形元素的 LF 在 [0.95,
1.05] 范围内,否则,所产生的图 表认为已经丧失了基本可信度
下面,我们实操一下,用谎言因子计算公式,对下图数据可视化图表进行评估。
第二,数据展示结合上下文
当谎言因子得到控制后,下一步我们还要注意,不能将数据的展示脱离其上下文,此处我们还是举一个例子。如下所示,是警察对超速严格执法前后,因交通事故死亡人数的变化。
左图给人造成了死亡人人数急剧下降的错误印象,而实际上,如右图所示,虽然严格执法起到了一定作用,但是对于死亡人数的影响并非那么立竿见影。
第三,展示数据变化而非图形和设计元素的变化
下图,我们能够看到右边部分在设计时明显被可以放大了(设计元素变化),这虽然有效的突出了右边部分数据信息,但却破坏了图表的诚实性,数据已然失真,使得右边部分和左边部分高度代表单位不统一,那么也就无法进行有效对比了。
四、结语
本期笔者为大家带来了数据可视化设计的第一基础原则——信,相信大家有所掌握,另外2个基础原则,我将在下期文章中陆续为大家揭秘。