面对数据集合dataset,有因变量Y和自变量X1,X2,X3,X4,要做的是:
1. 根据数据可以得到初步方程(假定为线性):
lm.sol <- lm(Y ~ X1+X2+X3+X4, data=dataset)
summary(lm.sol)
2. 如果发现不显著
(1)W正态性检验
y.res<-residuals(lm.sol)
shapiro.test(y.res)
如果不满足正态性假设,那么可以考虑剔除异常点
(2)画残差的Q-Q图
plot(lm.sol)
如果图中的点的大致趋势明显不在一条直线上,那么正态性假设则不合理,可以考虑改变式子
如果图中的某几个点偏离较大,那么这几个点是异常点,可以考虑剔除
(3)画标准化残差图(检验正态性)