回归诊断技术提供了评价回归模型使用性的必要工具,能帮助发现并且纠正问题。
有几种方法进行回归诊断。
分别是标准方法、car包中的函数、gvlma函数。建议先通过gvlma函数进行验证,如果违反假设条件,再使用其他方法来判断哪些假设没有满足并进行修改。
第一种:标准方法(了解),对lm()函数的返回对象使用plot()函数。
> fit<-lm(weight~height,data=women)
> par(mfrow=c(2,2))
> plot(fit)
最好满足线性假设(左上),残差正态性(右上)和同方差性(左下)。
线性假设:若因变量与自变量线性相关,那么残差值和预测值应该没有任何关联。如果在左上图中看到清楚的曲线关系,那么需要对回归模型加上一个二次项。
正态性:若满足正态假设,那么右上图的点应该落在呈45度角的直线上。
同方差性:若满足不变方差假设,那么左下图中,水平线周围的点应该随机分布。
从上面四个图可见&