转自个人微信公众号【Memo_Cleon】的统计学习笔记:线性回归中的方差齐性探察。
方差齐性,或者叫等方差性、同方差性,字面意思就是两组或多组的方差在统计学上相等,在方差分析或t检验中,取值相同的自变量水平有很多,因变量有充足的信息对方差进行分析。但在直线回归中,每个自变量“水平”的取值往往只有有限几个甚至只有1个,每个自变量一次抽样只能对应一个因变量,其对应的因变量观测值也只有几个甚至1个,每个“水平”的方差可能都没法计算,何来方差齐性呢?而且即使我们的样本量足够大,自变量的每一个“水平”多个取值,但由于自变量有太多的“水平”使得这种考察变得很艰难。线性回归中的等方差指因变量残差不随所有自变量取值水平的变化而变化,其检验实际上只是对因变量残差的一种探察。在自变量与残差或预测值和残差的散点图上,标准化残差随机、均匀的散布在0横线上下两侧,即不论自变量或因变量的预测值如何变化,标准化残差的波动基本保持稳定,可认为方差基本相等,但如果标准残差自变量或预测值增大出现扩散或收敛,则方差可能不齐。当然如果你觉得图示法太主观而不敢下结论,也可以改用统计学检验的方法。
示例采用[线性回归中的正态分布]一文中的示例。本例数据不多,图示法不好判断。
左上图为标准化预测值与标准化残差的散点图,在线性回归的SPSS操作可以直接生成,可参见[线性回归中的正态分布];
右上图为自变量与残差的散点图,STATA步骤如下,注意在模型诊断前首先要进行线性回归:
统计>>线性模型及相关>>线性回归:[模型]