一、线性回归描述
• 父亲身高与儿子身高存在相关(相关关系)
• 可否通过父亲身高预测儿子的身高?
• 新生儿的体重与体表面积存在相关
• 可否通过体重预测体表面积?(依存关系)
1、概述
例 为研究大气污染物一氧化氮(NO)的浓度是否受到汽车流量、气候状况等因素的影响,选择24个工业水平相近的城市的一个交通点,统计单位时间过往的汽车数(千辆)、同时在低空的相同高度测定了该时间段平均气温(℃)、空气湿度(%)、风速(m/s)以及空气
中一氧化氮(NO)的浓度(ppm),数据如表所示。
研究目的
• 通过探讨与一氧化氮(NO)浓度相关的影响因素,为控制空气污染提供依据。
• 研究一个变量的变化(如空气中NO浓度)受到另外一个或一些变量(如车流量)变化的制约。这些问题在统计学中采用线性回归模型(linear regression model)来进行分析。
基本概念
• 回归分析中,若
随
,
,…,
的改变而改变,则称
为反应变量(response variable),又称为因变量(dependent
variable);
•
,
,…,
为解释变量(explanatory variable),又称为自变量(independent variable),通常我们把自变量看作影响
因素(factors)。
• 简单线性回归(simple linear regression)——自变量个数仅一个
• 多重线性回归(multiple linear regression)——自变量个数超过两个
•
可以是随机变量,也可以是人为选择的数值
•
是按某种规律变化的连续型随机变量
2、简单线性回归模型
例,只考虑NO浓度与车流量的关系,以NO浓度为因变量,车流量为自变量,采用线性回归分析。问题如下:
问题
1. NO浓度随车流量的增加而增加吗?——散点图
2. 是直线趋势还是曲线趋势?——散点图
3. 如何采用回归方程定量地描述车流量对大气中NO浓度的影响?——线性回归方程
4. 车流量每增加100辆,NO浓度平均会增加多少?——回归方程的b值(回归系数)
5. 车流量对NO浓度的影响有统计学意义吗?——假设检验
6. 车流量对NO浓度的影响(贡献)有多大?——决定系数
7. 如何由车流量预测大气中NO平均浓度?——个体的容许区间、均数的置信区间
8. 如何通过控制车流量达到控制空气中NO浓度的目的?——根据求得的回归方程和给定的Y-hat值,求X值。
散点图
简单线性回归方程
以下为总体的线性回归方程,
表示在给定的X数值的情况下,Y值的总体平均水平。
回归系数的含义
的统计学意义是
每增加(或减少)一个单位,
平均改变
个单位(即