应用回归分析(4):违背基本假设的情况

考试会有上机题目!!!

4.1 异方差产生的背景和原因

4.1.1 异方差产生的原因

就是当随机扰动项和模型中的解释变量(自变量)存在某种相关性,就会出现异方差

比如:1、研究收入和购买量的关系,低收入家庭以日用品较多,但是高收入的家庭消费差异较大,导致消费模型的\varepsilon _i不同!

 4.1.2 异方差性带来的问题

解决:加权最小二乘估计、BOX-COX变换法、方差稳定性变换法

4.2  一元加权最小二乘估计

4.2.1 异方差性的检验

1、残差图分析法

横坐标的三种选择:拟合值\widehat{y},x_i,t/序号

纵坐标:e_i

结果:(a)当所有的残差在e=0的附近随机变化,并在变化幅度不大的一个区域里,说明回归模型满足基本假设;其余表现出趋势都不符合,都存在异方差

2、等级相关系数

也叫做Spearman检验

第一步、先做最小二乘回归计算出e_i

第二步、计算等级相关系数

第三步、 对等级相关系数做显著性检验

3、用spss实现

先计算出残差的绝对值,然后和x_i 以及进行sperman检验

计算绝对值:转换-计算变量-输入表达式

spearman检验:分析-相关-Spearman检验

不采用pearson简单相关系数,简单相关系数只可以反应线性关系。但是Spearman检验可以的反映出非线性相关的情况可以如实地反映出具有单调递增或递减趋势的变量间的相关性,而简单相关系数适合权衡直线趋势变量之间的关系

4.2.2 一元加权最小二乘估计

(1)解释权重的形式

加权最小二乘法:顾名思义就是 加上一个权重给给每一项,

这个权重要消除异方差:权重加在解释变量之前,大小应该是观测值误差项方差的倒数!,而

观测值误差项的方差和随机向量相关  

综上所述,  假设:

w_i = \frac{1}{x_{ij}^m}

(2)寻找权重中的最佳参数

就是单纯的试出来的

用spss实现:

1、分析--回归--权重估计(选项:将最佳权重作为新变量!)

找到右侧最大的值(最大似然函数的最大值)

然后可以得到最小二乘估计

2、验证是否消除异方差

残差更新为:\sqrt{w_i}e_{iw},把残差更新后可以选择画出残差图或者等级相关系数验证是否消除异方差!

4.3 多元加权最小二乘估计

难点:1、选择那个自变量作为权函数中的参数!2、权值应该是多少!

1、记住回归系数的新形式

2、权函数的确定方法:

计算每个自变量x_j和普通残差绝对值的等级相关系数,选择等级相关系数最大的作为权函数!

假如x3最大,则权函数为w_i = \frac{1}{x_3^m}  然后按照一元加权最小二乘估计  计算m的值即可!

4.4 自相关问题及其处理

4.4.1 产生的背景

违背的假设:cov(\varepsilon _i,\varepsilon _j)=0,i\neq j

随机误差项之间有相关关系!

(1)遗漏关键变量

(2)经济变量的滞后性

(3)采用错误的回归函数形式

(4)蛛网现象

(5)数据的不当加工

4.4.2 问题

4.4.3 检验

(1)图示检验法

  • 绘制e_t,e_{t-1}的散点图:大部分落在一、三象限说明\varepsilon _i存在正的序列相关;落在二、四象限则相反
  • 绘制e_tt的散点图:如果是不断的变换符号则--存在负相关;如果是几个正的后面跟着几个负的 则存在正相关

(2)自相关系数

取值范围在-1到1之间,当为1时正相关,当为-1时负相关。但是相关系数和样本量有关  所以要进行显著性检验是否存在 所以就被淘汰

(3)dw检验

  • dw形式

用dw检验代替 相关系数检验,主要适用于小样本且只能检验出一阶相关关系!

小样本:t分布、dw检验

  • dw范围

  • 结果解析

!!!dw和相关系数的关系:

DW \approx 2(1-\widehat{\rho })

dw检验的spss:

把这个选上就可以了!

4.4.4 自相关问题的处理方法

(1)迭代法

假设误差项存在一阶自相关

这时u_t时满足随机扰动项的基本假定,所以可以减掉一个\rho \cdot \varepsilon _{t-1} 这样就可以 使其满足基本假定!

其中的未知参数\rho的估计时通过dw检验 得到的!

用新得到的变量进行回归分析:然后再对残差进行自相关的诊断,如果不想管则结束,如果还是存在相关关系那么就重复这个过程,再来一次即可

(2)差分法

相当于迭代法中的\rho =1的情况

4.5 异常值与强影响点

在一元回归时,可以通过散点图或者残差图很方便的识别出异常值,但是在多元回归的分析中比较困难,需要更有效的方法!

异常值有两种:关于y异常;关于x异常

4.5.1 关于y异常:图形长

学生化残差SRE的绝对值大于3 视为异常值

4.5.2 关于x异常:图形宽

(1)高杠杆点

杠杆值大的点,即h_{ii}大的点(h_{ii})越大 则残差的方差越小(D(e_i) = (1-h_{ii})\delta ^2)。也叫做强影响点,但是强影响点不一定是异常值点。需要用库克距离判断

(2)库克距离

用来判断强影响点是不是异常值点

(3)中心化杠杠值

判断时和之前的一样,大于2到3倍时就可以看作强影响点!

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值