本笔记中原始数据及代码均来源于李东风先生的R语言教程,在此对李东风先生的无私分享表示感谢。
强影响点是删去以后严重改变参数估计值的观测。 包括自变量取值离群和因变量拟合离群的点。 杠杆(leverage)指帽子矩阵的对角线元素hii,
其中di是第i个观测的重复观测次数。 某观测杠杆值高说明该观测自变量有异常值。 杠杆值大于2p/n的观测需要仔细考察 (有截距项时p等于自变量个数加1)。 若lmres是R中lm()的回归结果, 用hatvalues(lmres)可以求杠杆值。 考察外学生化残差ti, 绝对值超过2的观测拟合误差大, 在y方向离群,需要关注。
若lmres是R中lm()的回归结果, 用rstudent(lmres)可以求外学生化。 Cook距离统计量:
包含了y方向的离群ri和x方向的离群hii的信息。 超过4/n 的值需要注意。 若lmres是R中lm()的回归