多重线性回归(multiple linear regression)是简单线性回归的推广,它考虑多个因素对一个结果的影响,是一种常用的多变量统计分析方法。用y表示因变量,x表示自变量,y只有一个,设x有p个,用向量形式可以表示为(x1,...,xp)。多重线性回归使用最小二乘法来解决方程的估计和检验问题,回归方程的数学模型为:
β0为常数项,β1,...,βp为偏回归系数(partial regression cofficient),ε为随机误差,又称残差(residual),是y的变化中不能用自变量解释的部分 (y-y^=ε),独立服从正态分布。
由样本估计的多重线性回归方程为:
y^为各x取一组定值时,因变量y的估计值;b0为常数项,又称截距,是当所有自变量取值为0时因变量的估计值;bi为自变量xi的偏回归系数,表示当其他自变量保持不变时,自变量xi每改变一个单位引起因变量的变化。
如果要建立固体垃圾排放量(y)与餐饮业与宾馆用地面积(x1)、运输及批发商业用地面积(x2)、工业企业用地面积(x3)、零售业用地面积(x4)、金属制造业用地面积(x5)之间的线性回归方程,模型可以写成: