应用回归分析(4)：违背基本假设的情况

Oasis of the World

已于 2023-12-12 22:08:08 修改

阅读量647

点赞数

分类专栏：应用回归分析及spss部分使用文章标签：开发语言

于 2023-11-28 16:39:59 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_64279967/article/details/134413922

版权

应用回归分析及spss部分使用专栏收录该内容

6 篇文章 1 订阅

订阅专栏

考试会有上机题目！！！

4.1 异方差产生的背景和原因

4.1.1 异方差产生的原因

就是当随机扰动项和模型中的解释变量（自变量）存在某种相关性，就会出现异方差

比如：1、研究收入和购买量的关系，低收入家庭以日用品较多，但是高收入的家庭消费差异较大，导致消费模型的 $\varepsilon _i$ 不同！

4.1.2 异方差性带来的问题

解决:加权最小二乘估计、BOX-COX变换法、方差稳定性变换法

4.2 一元加权最小二乘估计

4.2.1 异方差性的检验

1、残差图分析法

横坐标的三种选择：拟合值 $\widehat{y},x_i,t/$ 序号

纵坐标： $e_i$

结果：（a）当所有的残差在 $e=0$ 的附近随机变化，并在变化幅度不大的一个区域里，说明回归模型满足基本假设；其余表现出趋势都不符合，都存在异方差

2、等级相关系数

也叫做Spearman检验

第一步、先做最小二乘回归计算出 $e_i$

第二步、计算等级相关系数

第三步、对等级相关系数做显著性检验

3、用spss实现

先计算出残差的绝对值，然后和 $x_i$ 以及进行sperman检验

计算绝对值：转换-计算变量-输入表达式

spearman检验：分析-相关-Spearman检验

不采用pearson简单相关系数，简单相关系数只可以反应线性关系。但是Spearman检验可以的反映出非线性相关的情况可以如实地反映出具有单调递增或递减趋势的变量间的相关性，而简单相关系数适合权衡直线趋势变量之间的关系

4.2.2 一元加权最小二乘估计

（1）解释权重的形式

加权最小二乘法：顾名思义就是加上一个权重给给每一项，

这个权重要消除异方差：权重加在解释变量之前，大小应该是观测值误差项方差的倒数！，而

观测值误差项的方差和随机向量相关

综上所述，假设：

$w_i = \frac{1}{x_{ij}^m}$

（2）寻找权重中的最佳参数

就是单纯的试出来的

用spss实现：

1、分析--回归--权重估计（选项：将最佳权重作为新变量!）

找到右侧最大的值（最大似然函数的最大值）

然后可以得到最小二乘估计

2、验证是否消除异方差

残差更新为： $\sqrt{w_i}e_{iw}$ ，把残差更新后可以选择画出残差图或者等级相关系数验证是否消除异方差！

4.3 多元加权最小二乘估计

难点：1、选择那个自变量作为权函数中的参数！2、权值应该是多少！

1、记住回归系数的新形式

2、权函数的确定方法:

计算每个自变量 $x_j$ 和普通残差绝对值的等级相关系数，选择等级相关系数最大的作为权函数！

假如x3最大，则权函数为 $w_i = \frac{1}{x_3^m}$ 然后按照一元加权最小二乘估计计算m的值即可！

4.4 自相关问题及其处理

4.4.1 产生的背景

违背的假设： $cov(\varepsilon _i,\varepsilon _j)=0,i\neq j$

随机误差项之间有相关关系！

（1）遗漏关键变量

（2）经济变量的滞后性

（3）采用错误的回归函数形式

（4）蛛网现象

（5）数据的不当加工

4.4.2 问题

4.4.3 检验

（1）图示检验法

绘制 $e_t,e_{t-1}$ 的散点图：大部分落在一、三象限说明 $\varepsilon _i$ 存在正的序列相关；落在二、四象限则相反
绘制 $e_t$ 和 $t$ 的散点图：如果是不断的变换符号则--存在负相关；如果是几个正的后面跟着几个负的则存在正相关

（2）自相关系数

取值范围在-1到1之间，当为1时正相关，当为-1时负相关。但是相关系数和样本量有关所以要进行显著性检验是否存在所以就被淘汰了

（3）dw检验

dw形式

用dw检验代替相关系数检验，主要适用于小样本且只能检验出一阶相关关系！

小样本：t分布、dw检验

dw范围

结果解析

！！！dw和相关系数的关系：

$DW \approx 2(1-\widehat{\rho })$

dw检验的spss：

把这个选上就可以了！

4.4.4 自相关问题的处理方法

（1）迭代法

假设误差项存在一阶自相关

这时 $u_t$ 时满足随机扰动项的基本假定，所以可以减掉一个 $\rho \cdot \varepsilon _{t-1}$ 这样就可以使其满足基本假定！

其中的未知参数 $\rho$ 的估计时通过dw检验得到的！

用新得到的变量进行回归分析：然后再对残差进行自相关的诊断，如果不想管则结束，如果还是存在相关关系那么就重复这个过程，再来一次即可

（2）差分法

相当于迭代法中的 $\rho =1$ 的情况

4.5 异常值与强影响点

在一元回归时，可以通过散点图或者残差图很方便的识别出异常值，但是在多元回归的分析中比较困难，需要更有效的方法！

异常值有两种：关于y异常；关于x异常

4.5.1 关于y异常：图形长

学生化残差SRE的绝对值大于3 视为异常值

4.5.2 关于x异常：图形宽

（1）高杠杆点

杠杆值大的点，即 $h_{ii}$ 大的点（ $h_{ii}$ ）越大则残差的方差越小（ $D(e_i) = (1-h_{ii})\delta ^2$ ）。也叫做强影响点，但是强影响点不一定是异常值点。需要用库克距离判断

（2）库克距离

用来判断强影响点是不是异常值点

（3）中心化杠杠值

判断时和之前的一样，大于2到3倍时就可以看作强影响点！

Oasis of the World

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
应用回归分析(4)：违背基本假设的情况

考试会有上机题目！！！
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。