介绍
散点图在直角坐标系显示数据的两个变量(X和Y轴)之间的关系,数据显示为点的集合,适合用于在不考虑时间的情况下比较大量的数据点。散点图通常用来识别两个变量之间的相关性或用来观察他们的关系,从而发现某种趋势,对于查找异常值或理解数据分布也很有效。如下图某个班级学生身高和体重的分布状况。
散点图会显示不同类型的相关性,相关性即变量之间的关系。通常有正相关、负相关、不相关三种相关性。
正相关:数据点从低x、y值的点到高x、y值,一个变量增加,另一个变量增加。
负相关:数据点从高x、y值的点到低x、y值,一个变量增加,另一个变量减少。
不相关:数据没有明显的方向性,一个变量变化对另一个没有影响。
需要注意的是,散点图能够有效的说明两个变量之间的相关性,但是并不能有力地证明其中存在因果关系。例如广告投放量和点击率是正相关的,但是不能说点击率高一定是因为广告投放量多造成的。但是,如果有明显的正相关性,就有足够的理由去增加投放量,然后再去观察数据。
适合的数据类型
X
Y
A
30
15
B
20
17
C
23
13
类似图表
气泡图
散点图的使用建议
1、如果一个散点图没有显示变量之间的任何关系,那么或许该图表类型不是此数据的最佳选择。
2、如果数据包含不同系列,可以给不同系列使用不同的颜色,例如蓝色代表