概念
回归模型通过对观测数据拟合一条直线来描述变量之间的关系。回归估计一个因变量如何随着自变量的变化而变化。
多重线性回归是用来估计两个或多个自变量和一个因变量之间的关系。
!!!此处注意区分
1)简单(simple)线性回归 :1个自变量,1个因变量
2)多因素(multivariable)或多重(multiple)线性回归:多个自变量,1个因变量
3)多元或多变量(multivariate)线性回归:1个自变量,多个因变量
多重线性回归的假设
方差齐性(同方差) : 我们的预测误差的大小在自变量的值之间没有显著的变化。
观察的独立性: 数据集中的观察数据采用统计学上有效的方法收集,变量之间没有隐藏的关系。
在多线性回归模型中,有可能一些自变量实际上是相互关联的,所以在开发回归模型之前检查这些是很重要的。如果两个自变量的相关性太高(r2 > 0.6) ,那么在回归模型中只能使用其中的一个。
正态性: 数据服从正态分布。
线性: 通过数据点的最佳拟合线是一条直线,而不是一条曲线或某种分组因子。
如何执行多重线性回归
多重线性回归的公式如下: