当我们需要从大量数据中寻找变量之间的关系时,不妨尝试一下散点图。
散点图主要用于描述变量之间是否存在相关性,以及这种相关性是线性还是非线性。在对于离群值的观察上,也是一个好的选择。
本文主要介绍几种散点图/气泡图的绘制方法,以及简要讲解一下其原理。
数据源 为tableau自带示范数据-世界发展指标 。
一、散点图
假如我们描述人均医疗费用和新生儿死亡率之间的关系
1、将人均医疗费用拖入列,新生儿死亡率拖入行。这时工作表如下
请思考这里为什么只有一个点? 原因是 tableau默认将这两个度量进行了汇总。而我们想看的是这两个变量之间的关系。
2、分别点击行、列功能区的字段,右键转化为维度。 这时一个散点图就初见雏形了。散点图的本质是将每一条数据在笛卡尔坐标系中按照x-y点的形式展现在图中,你可以理解为,点的个数即为你当前上下文的行数。
我们可以看到,新生儿死亡率和人均医疗费用成明显的反比例关系,人均医疗费用越高,这和认知是符合的。
3、我们可以进一步分析世界不同大洲的新生儿死亡率和人均医疗费用。
将区域拖入标记功能区-颜色。