数据可视化

数据可视化,指的是量化信息的可视化。(Edward Tufte的开创性研究成果)

为什么要进行可视化?安斯库姆四重奏

Gapminder上的可视化案例
不同的数据类型1 - 数值变量
不同的数据类型2 - 分类变量
不同的数据类型3 - 时间续列变量

数据类型汇总
定量
定量数据是可以用数字衡量的数据,例如温度、金钱和猫咪的抓痕数。你可以将定量数据分成两组:连续数据和离散数据。离散数据只能包含特定的值。例如,交易售出的商品数量只能是正整数,你不可能购买 2.5 个枕头(或 2.5 只猫!)

连续数据可以是某个范围内的任何值,例如时间、高度或金钱。

定性
定性数据是对事物进行描述的信息,无法用数字量化,例如男性/女性和头发颜色。这些是分类数据,表示属于某个类别和组。通常,你需要按照类别对数据分组并进行对比。

数据还可以是有序数据,例如排名和在问卷调查中看到的主观量表,例如“你觉得炸玉米饼怎么样?”

好恶心!
不好吃
还行
好吃
很美味!
你有时候会看到有序数据被编号了(1 到 5),但是这些数字并不表示任何含义。

这些是你将看到的典型数据类型。你可能会处理图片或文字,这些内容似乎不符合上述类别。但是大部分情况下,你可以将它们转换为数字或类别。

以下是到目前为止的总结
定量
连续
时间、高度、重量、金钱、利率、温度
离散
出售的数量、会的语言数量、昨天收到的邮件数量
定性
分类
性别、头发颜色、国家/地区、猫咪品种
有序
排名、调查问卷问题,例如“你对猫咪有何感受?”
讨厌猫咪
不喜欢
保持中立
喜欢
非常喜欢
下面的流程图可以帮助你明白你的数据归为何种数据类型。
这里写图片描述

用视觉元素表示数据
在可视化数据时,你会使用视觉元素(例如点、线、长条)表示数值。例如,如果查看多个人的身高和体重,可以用一个点表示每个人的身高和体重值。
这里写图片描述
这里有两个点,表示两个人。体重和身高值在图中用点的位置(相对于坐标轴上的刻度)表示。左侧的点表示体重值 70.0 公斤,身高约为 1.72 米(根据点到坐标轴的虚线确定)。


对于定量数据,尤其是对比两个变量时,建议使用点。对于上述示例,你可以看出如何表示更多的数据。
这里写图片描述
点是最准确的表示方法,即与其他视觉元素相比,人类更善于确定用点表示的值。从点到坐标轴画个直线很简单。点就像图片上的小空间,很容易看出所表示的值。用线条或长条表示此类数据的话,会很混乱。

线条
线条适合将相关的数据相连,并帮助我们用肉眼观察。对于一段连续数据(例如时间)来说,适合用线条,这时候点就不合适了。看看下面这个只用点表示的时间数据图表,另一个用线条表示。
这里写图片描述
这里写图片描述
用线条表示冰激凌销量的季节性变化趋势。人们凭直觉就能从线条上看到趋势,而点则表示这些数据没有联系。

线条还非常适合显示不同组之间的变化。Edward Tufte 发明了一种可视化图表,叫做“坡度图”,这种图非常适合显示根据时间而变化的一系列群组。如果你感兴趣的话,请阅读这篇文章,其中很好地介绍了坡度图的发展历史和用途。坡度图

因为人们可以从线条里看到趋势,所以如果某种趋势不合理的话,则不适合使用线条,例如下图:
这里写图片描述
条形图只能表示一个数值(用左侧的 y 轴表示),适合对比几组数据(家居、电子产品、供应品、服务)。我们很快就能看出每组的利润对比情况。
颜色
颜色通常用来表示第三个维度,因为很难在二维平面(例如计算机屏幕)上表示三维数据。可以是连续数据 (例如热度图)或离散数据(将数据分成几个组)。
这里写图片描述
Stephen Few 写了一遍很棒的关于视觉编码的文章。共 8 页,里面有很多图表,只需 10 分钟左右的时间就能看完。不妨阅读一下。如果你偏离折线表示方法,你的读者可能就无法理解你的意思,就好像你用错误的词汇与他人交流一样。

视觉编码排序

数据可视化的工具图普
目前大家可以看到的可视化工具非常多,我们很难在课程中对其一一介绍。不过,我们会为大家介绍我们的思考框架,它可以帮助你判断哪个可视化工具更加适合。一般来说,工具需要在适用范围和生产力两方面有所权衡。使用那些适用范围更广的工具可以帮助你创建各种不同的可视化要求而不受各种定制需求的限制,然而,这类工具往往学习曲线会比较高,作图所花的时间也会比较长。在硬币的另一面,那些高生产力的工具,比如 Tableau 或者 RAW,可以让你“无痛”作图,然而只限定在指定的一些可视化类型中。

工具金字塔
上面所提到的权衡可以通过下面的这个金字塔所展示出来。金字塔的宽度代表工具的适用范围,高度代表工具的生产力,或者说使用起来有多方便。
这里写图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值