线性回归违背基本情况的假设-异方差、自相关、异常值

最新推荐文章于 2024-11-16 12:32:40 发布

weixin_50304531

最新推荐文章于 2024-11-16 12:32:40 发布

阅读量2k

点赞数 1

分类专栏：数据挖掘理论文章标签：线性回归算法概率论

本文链接：https://blog.csdn.net/weixin_50304531/article/details/121008238

版权

本文详细探讨了回归分析中常见的三个问题：异方差性、自相关和异常值。异方差性可能导致参数估计的方差过大、显著性检验失效及预测效果不佳。解决方法包括加权最小二乘估计。自相关则可能造成参数估计失去最小方差线性无偏性，可通过迭代法和差分法处理。对于异常值，可通过标准化和学生化残差识别，并采取删除残差法处理。理解并正确处理这些问题对于提高回归模型的准确性和可靠性至关重要。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

参考：
违背基本情况的假设-4.1-4.3异方差问题
 违背基本情况的假设-4.4自相关问题
 违背基本情况的假设-4.5异常值问题

1 违背基本情况的假设-异方差

假定随机误差项 $\varepsilon_1,\varepsilon_2,\cdots,\varepsilon_n$ 具有等方差，独立或不相关关系。
即G-M条件
在这里插入图片描述

违背基本假设的情况：

第一种情况：异方差
$var(\varepsilon_i) \neq var(\varepsilon_j), i\neq j$
第二种情况：自相关
$cov(\varepsilon_i,\varepsilon_j)\neq 0$

1.1 异方差产生的原因

由于实际问题具有错综复杂性，故在回归模型建模时，某一因素或一些因素随着解释变量观测值的变化而对被解释变量产生不同的影响，导致随机误差项产生不同方差。
在这里插入图片描述

## 1.2 异方差性带来的问题当存在异方差时，普通最小二乘估计存在以下问题：

$\diamondsuit$ 参数估计值虽是无偏调度，但不是最小方差线性无偏估计；
当异方差存在时， $D(\hat{\beta})$ 大于同方差条件下的方差。

$\diamondsuit$ 参数的显著性检验失效；
当异方差存在时，若继续用最小二乘估计来估计参数，将会低估 $D(\hat{\beta})$ ，进一步高估回归系数的 T 统计量的值，最后造成某些不显著的回归系数变显著。

$\diamondsuit$ 回归方程的应用效果极不理想。

1.3 异方差性的检验

异方差检验方法：
1、残差图分析法
2、等级相关系数法（斯皮尔曼检验(Spearman)）

1.3.1 残差图分析法

在这里插入图片描述
a 图：不管 x 如何变化，方差始终在一定的范围内( $±3σ \pm3\sigma$ )变化。
b图：随着 x 的变化，方差逐渐增大，出现了异方差性。

1.3.2 等级相关系数法（斯皮尔曼检验(Spearman)）

第一步：作 $y$ 关于 $x$ 的普通最小二乘回归，求出 $\varepsilon_i$ 的估计值，即 $e_i$ 的值。

第二步：取 $e_i$ 的绝对值，即 | $e_i$ | 的，把 $x_i$ 和 | $e_i$ | 按递增或递减的次序排列后分成等级，然后计算 $x_i$ 和 | $e_i$ | 的等级差数 $d_i$ ，再按下式计算出等级相关系数
$r_s=1-\frac{6}{n(n^2-1)}\sum_{i=1}^nd_i^2$
其中 $n$ 为样本容量。

第三步：做等级相关系数的显著性检验。
在 $n > 8$ 的情况下，用下式对样本等级相关系数 $r_s$ 进行 $t$ 检验
$H_0:r_s=1,H_1:r_s \not= 0$

最低0.47元/天解锁文章