数据关系型图表
散点图系列
趋势显示二维散点图 分布显示二维散点图
气泡图
三维散点图
曲面拟合图
等高线图
散点曲线图系列
瀑布图
相关系数图
趋势显示二维散点图
散点图(scatter graph,point graph,X-Y plot,scatter chart 或scattergram)是比较常见的图表类型之一,通常用于显示和比较数值;散点图使用一系列的散点在直角坐标系中展示变量的数值分布;在二维散点图中,可以通过观察两个变量的数据分析,发现两者的关系与相关性;
散点图通常包括三类关键信息:
变量之间是否存在数量关联趋势;
如果存在关联趋势,是线性还是非线性?
观察是否存在离群值,从而分析这些离群值对建模分析的影响;
通过散点图上数据点的分布情况,可以推断出变量之间的相关性;
如果变量之间不存在相互关系,则散点图上就会表现为随机分布的离散的点;
如果存在某种相关性,那么大部分的数据点就会相对密集并以某种趋势呈现;
数据的相关关系主要分为:
正相关(两个变量值同时增长)
负相关(一个变量值增加、另一个变量值下降)
不相关
线性相关
指数相关;那些离点集群较远的点称为离群点或异常点(outliers)
相关分析
一般要求出相关关系,以相关系数的大小来判断自变量和因变量的相关程度;强相关、弱相关、无相关;散点图经常与 回归线(line of best fit就是最准确的贯穿所有点的线)结合使用;
归纳分析现有数据实现曲线拟合,以进行预测分析;
散点图能较好的分析那些变量之间存在密切关系;回归分析构建检验因变量与一个或多个自变量的关系的数学模型;这些模型可以用于预测自变量的未观察值和或未来值的响应;
按学习进度,计划从今天开始学习散点图系列,每天学习,积累数据可视化分析基础技能;