计量经济学与stata应用（一）：异方差与自相关

最新推荐文章于 2024-05-26 22:35:57 发布

Kentos(acoustic ver.)

最新推荐文章于 2024-05-26 22:35:57 发布

阅读量3k

点赞数 30

文章标签：数据分析概率论

本文链接：https://blog.csdn.net/weixin_56631477/article/details/136419458

版权

博客聚焦于数据分析中的异方差和自相关问题。异方差指随机扰动项方差不再为常数，介绍了F、White、B - P三种检验方法及OLS + robust、WLS等处理方式；自相关主要存在于时间序列数据，提及BG - LM、Q、DW检验法，以及Newey - West、FGLS等处理手段，还给出了结果稳健性判断方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

异方差问题

异方差是指随机扰动项的方差不再是常数 $\sigma ^{2}$ ，而是依赖于下标 $\mathit{i}$ ，此时高斯-马尔可夫假定下的检验统计量都不成立。

可以通过残差分布图看其波动性。

rvfplot //做横轴为拟合值、纵轴为残差的散点图

检验

F检验

残差的平方对解释变量回归

原假设：回归系数全为0

predict e1,r //生成残差e1
gen sque1 = e1*e1 //生成残差的平方sque1
reg sque1 varlist //残差的平方对解释变量回归
test varlist //检验联合显著性

若p值<0.05，则拒绝原假设，即残差的平方可以被某些解释变量解释，存在异方差。

White检验

原假设：残差同方差

sec install whitetst, replace //安装外部命令White检验
whitetst //法1
estat imtest, white //法2

若p值<0.05，则拒绝原假设，即残差存在异方差性。

B-P检验

原假设：残差同方差

reg varlist //先回归
estat hettest varlist //法1
bpgan varlist //法2

若p值<0.05，则拒绝原假设，即残差存在异方差性。

上面的F检验、White检验和B-P检验三种检验方式的结果一致，即存在异方差性。

处理

OLS+robust稳健标准误

由于异方差是普遍存在的，所以这种方法是最常使用的；

当采用普通标准误时回归系数是显著的，而当采用稳健标准误时就不一定是显著的了。

reg varlist, robust

WLS加权最小二乘法

reg varlist //先回归
predict e, re //生成残差变量e
gen lnesqu = log(e^2) //对残差的平方取自然对数
reg lnesqu var1, noc //将残差平方对某一解释变量var1回归

如果回归的结果显示残差能被某一解释变量解释，其中 $\mathit{R}^{2}$ 表示该解释变量能解释残差平方总变动的多少，比如 $\mathit{R}^{2} = 0.7447$ 就表示该解释变量可以解释残差平方总变动的74.47%

采用加权最小二乘法解决异方差问题，由于方差较小的数据提供的信息量较大，方差较大的数据提供的信息量较少，故使用方差的倒数做权重进行回归。

predict yaht //保存用解释变量var1解释的yaht
gen exyaht = exp(yaht) //把方差信息存储于变量exyaht中
reg varlist [aweight = 1/exyaht] //以方差的倒数做权重进行回归

自相关问题

随机变量与自身（不同时间，也叫滞后）的相关性，主要存在于时间序列数据。

可以通过绘制残差和残差的滞后一期的散点图，从图形上观察是否可能存在自相关问题。

tsset time //设定时间序列的时间变量
reg varlist //回归
predict e, re //将回归的残差保存为变量e
gen le = l.e1 //用滞后一期e1生成新变量le
scatter e le //对残差和残差的滞后一期做散点图
corrgram e //残差的相关系数矩阵

检验

做完回归后再进行检验

BG-LM检验

原假设：无自相关问题

estat bgodfrey

若p值<0.05，则拒绝原假设，即残差存在自相关。

Q检验

原假设：无自相关问题

wntestq e

若p值<0.05，则拒绝原假设，即残差存在自相关。

DW检验

estat dwatson

若DW值远小于2，则存在正的自相关。

处理

Newey-West方法

OLS+HAC(异方差与自相关条件下的稳健标准误)

newey varlist, lag(3) //先取Newey-West滞后阶数为3
newey varlist, lag(5) //改变滞后阶数看稳定性如何

将滞后阶数由3改为5之后，重新执行命令，发现Newey-West标准误变化不大，则此方法结束。

OLS+vce(cluster)

聚类稳健标准误，对于面板数据vce(robust)=vce(cluster)

reg varlist, vce(cluster)

FGLS可行广义最小二乘估计

模型满足严格外生性时比较有效，否则可能不一致，不如OLS稳健；

外生性：解释变量与扰动项不相关。

修改模型

可能模型设定有误，比如遗漏自相关的解释变量，或将动态模型错误地设定为静态模型。

处理之后再检验：如果系数的估计值与标准误不会随着估计方法的改变而发生较大幅度的变化，就说明估计结果时比较稳健的。