课程读者问我,为什么需要残差图?怎么看残差图?
线性回归有诸多假设条件,对于残差来说,要求符合正态性、同方差、无自相关,因此残差诊断分析成为线性回归中必不可少一个环节。
(上图来自医咖会微信号)
利用残差图来判断检验以上残差问题是常用,直观,而且简单有效的方法。
具体来说,残差图是指以某种残差为纵坐标,以其他适宜的变量为横坐标的散点图,所以残差图、残差散点图都是一个概念。这里横坐标有多种选择,最常见的选择是:1.因变量的拟合值;2. 某自变量的观察值等。
那怎么看残差图呢?能看出什么吗?我的经验是,利用反证法、倒推的方法来看。
咱们先明确一下完全满足线性回归假设条件的情况下,残差图应该什么样子的,把这个特征作为标准,然后自己做残差图出来,只要发现它的分布特征和标准有偏离,那么就可以认为残差诊断存在问题。
一般统计教材关于线性拟合完美残差图的描述大概是这样子的:
残差均值为0;
各残差点随机、均匀分布与-2到2之间;
残差点的分布看不出任何规律;
残差不应该包含任何可预测的信息;
好,这些特征就是金标准了,我们可以简单粗暴的,把与此金标准有较大偏差的残差图,都认为是或多或少存在问题的即可。
有人用散点图的形式做了形象展示:
(上图来