1.什么是残差?
残差即因变量的观测值Yi与利用回归模型求出的预测值^ Y之间的差值,反映了利用回归模型进行预测引起的误差。
2.怎么测量残差是否符合正态性?
例子:分析住院费用与医院级别、地区、患者年龄、住院天数等的关系。
数据展示:
通过P-P图可以检验数据是否符合指定的分布。当数据符合指定分布时,P-P图中各点近似呈一条直线。
Step1:因为多重线性回归要求因变量符合正态分布,因此先利用直方图检验因变量“住院总费用”是否服从正态分布,结果如下:
结果:住院总费用不服从正态分布,需进行数据转换,可使用对数转换。在【转换】→【计算变量】中对“住院总费用”进行对数转换,新变量命名为“stan”。再重新绘制直方图,如下: