统计学(第6版) 贾俊平 读书笔记
第11章 一元线性回归
11.1 变量间关系的度量
变量之间的关系可分为两种类型,即函数关系和相关关系。其中,函数关系是一一确定的关系,给定一个自变量x,因变量y依确定的关系取相应的值;变量之间存在的不确定性的数量关系,则称为相关关系。
相关系数
相关关系可以通过散点图和相关系数来反映。相关系数是根据样本数据计算的度量两个变量之间线性关系强度的统计量,其计算公式为:
按照上述公式计算的相关系数也称为线性相关系数,或称为Pearson相关系数。
r的取值范围是[-1, 1]。若0 < r ≤ 1,表明x与y之间存在正线性相关关系;若-1 ≤ r < 0,表明x与y之间存在负线性相关关系。
r具有对称性,rxy = ryx。
11.2 一元线性回归
描述因变量y如何依赖自变量x和误差项ε的方程称为回归模型。只涉及一个自变量的一元线性回归模型可表示为:
回归模型中,假定ε的期望值等于0,因此y的期望值E(y) = β0 + β1x,也就是说,y的期望值是x的线性函数。描述因变量y的期望值如何依赖于自变量x的方程称为回归方程。
若总体回归参数 β0和 β1是未知的,必须利用样本去估计它们。用样本统计量去代替回归方程中的未知参数 β0和 β1,这时就得到了估计的回归方程。对于一元线性回归,估计的回归方程形式为: