1. 什么是散点图
散点图(Scatter Plot or Scatter Chart),也叫散布图,顾名思义就是由一些散乱的点组成的图表,这些点在哪个位置,是由其X值和Y值确定的。所以也叫做XY散点图。它将所有的数据以点的形式展现在直角坐标系上,以显示变量之间的相互影响程度,点的位置由变量的数值决定。
在分析独立数据时,用直方图、柏拉图就可以直接找到改善着眼点,但是要解析两个变量X、Y之间的相关性时,就要用到散点图。如钢的淬火温度和硬度,螺丝的扭矩和抗张强度,油的温度与粘度,玻璃中含铅量与抗辐射等。
人们经常用散点图来表述两个连续变量X和Y之间的关系,图中的每个点表示目标数据集中的每个样本,在直角坐标系平面上数据点的分布和因变量随自变量而变化的大致趋势。由此趋势可以选择合适的函数进行经验分布的拟合,同时散点图中常常还会拟合一些直线和曲线,以用来表示某些模型,进而找到变量之间的函数关系。
2. 散点图的作用
散点图将序列显示为一组点,值由点在图表中的位置表示,类别由图表中的不同标记表示。散点图通常用于比较跨类别的聚合数据,其应用有很多,总结两个常见的应用如下。
2.1 回归分析
散点图用于回归分析中,数据点在直角坐标系平面上的分布图,散点图表示因变量随自变量而变化的大致趋势&