引言
- 包含信息和实事的数据是可视化的基础
- 好的可视化设计是一个曲折的过程,需要具备统计学和设计方面的知识,只有同时具备了这两种技能,才能随心所欲的在数据研究和讲故事两者之间自如切换。
- 除了真实的数字之外,还有重要的背景信息。数据是谁的,他从哪来,以及是什么时候收集的。
可视化不只是一种工具
- 激发感情和好奇心
- 便于阅读且十分精确
第一章 你真的理解数据了吗?
数据表达了什么
- 数据是现实世界的一个快照
- 你需要观察数据产生的来龙去脉,并把数据集作为一个整体来理解。
- 它们只是提取真实事物的一个个片段。你只能获取零碎的信息,然后寻找其中的模式和关联,凭经验猜测数据所表达的含义。数据和它所代表事物之间的关联即使把数据可视化的关键,也是全面分析数据的关键。
- 数据是对现实世界的简化和抽象表达。当你可视化数据的时候,其实是在将对现实世界的抽象表达可视化。可视化是对数据的一种抽象表达,即一个抽象的抽象。
数据的可变性
- 平均值、中位数、总数是稳定的的同时,具体数的数值时变化多端的,这些数值可能比统计测量值更有价值。
- 离群值可能是需要修正或特别注意的。
数据的不确定性
大部分数据是估算的,并不精确
数据所依存的背景信息
离开背景信息,数据就毫无用处了,而基于他们创建的任何可视化内容也会变得没有价值。你必须首先了解何人、何处、何事、何时、何地、何因,即元数据,或者说关于数据的数据,然后才能了解数据的本质是什么。
- 何人(who):“谁收集了数据”,收集人是否可靠;“数据是关于谁的”
- 如何(how):大致了解怎么获取你感兴趣的数据。小心小样本,小心不合理的假设。
- 何事(what):要知道数据是关于什么的,围绕在数字周围的信息是什么。
- 何时(when):数据是什么时候采集的
- 何地(where):地理定位(城市、州、国家)、数字定位(Twitter、Facebook)
- 为何(why):了解收集数据的原因,通常是为了检查一下数据是否存在偏颇。
背景信息能够帮助你为数据图形增添一个维度,但有时背景信息意味着你需要对信息有所保留,因为那样做是对的(密码、维基解密)