回归诊断:帮助我们发现并纠正问题,告诉我们模型是否合适,提供了评价回归模型适应性的必要工具。
比如:样品是否符合正态分布假设?是否存在离群群值使模型产生较大误差?线性模型是否合理?误差是否满足独立性(误差不会随着因变量大小而变化)、等方差、正态分布等假设条件?是否存在多重共线性(自变量不独立)?
标准方法:R中提供了大量检验回归分析中统计假设的方法。plot()函数
R语言例子:
fit<-lm(weight~height,data=women)
par(mfrow=c(2,2)) %将plot绘制的四幅图形组合在一个大的2*2的图中
plot(fit)
运行结果:
回顾OLS回归假设:
1.正态性:当预测变量值固定