Stata: 协整还是伪回归?

本文通过模拟数据详细介绍了Stata中协整与伪回归的概念及区别。协整意味着时间序列间存在长期均衡关系,而伪回归在有限样本中可能导致显著但错误的统计结果。通过Engle-Granger方法可以检验协整关系,并利用OLS估计量进行分析。文章通过实例展示了如何使用Stata进行协整检验,并提供了相关代码示例。
摘要由CSDN通过智能技术生成

作者:许梦洁 (编译) (知乎 | 简书 | 码云)

Stata连享会 「Stata 现场班报名中……」

Source: Ashish RajbhandariCointegration or spurious regression?


时间序列数据经常是不平稳的而且序列之间往往有一定程度上的联动关系。一组时间序列协整意味着这组序列内存在一个长期的均衡关系。如果这种长期的均衡关系不存在,则表面上的联动则是无意义的。

分析多个不平稳的时间序列是否协整可以帮助理解它们的长期表现。把30年的美国政府债券的利率看作是长期利率,把3个月的同种债券的利率看做是短期利率。根据相关理论,长期利率应该是短期利率的未来预期收益的平均值。这意味着这两个利率之间在一定时间段内不可能有太大的偏离。也就是说,如果这两个利率有协整关系,任何影响短期利率的因素也将带来长期利率的调整。这个见解在做一些政策和投资决策的时候非常有用。

在协整分析中,我们会将一个不平稳的序列对一系列其他不平稳序列进行回归。令人惊讶的是,在有限样本中,用不平稳序列对其他不平稳序列进行回归往往都能得到很显著的系数和很高的 R 2 R^2 R2。这种情况虽然看起来很像协整,但实际上往往是伪回归。

在这篇文章中,我会用模拟数据来分别展示在协整和伪回归下 OLS 估计量的渐近性质,然后使用 Engle and Granger(1987) 的方法来检验协整关系。

1. 协整

我们考虑两个一阶协整的两个变量 y t y_t yt x t x_t xt ,这意味着它们各自是 I ( 1 ) I(1) I(1),也就是说它们各自可以通过一阶差分变成平稳序列。

如果 y t y_t yt x t x_t xt 的线性组合是 I ( 0 ) I(0) I(0),这意味着 α [ y t , x t ] ′ = e t \alpha[y_t,x_t]'=e_t α[yt,xt]=et,其中 β \beta β 是协整向量, e t e_t et 是平稳的均衡误差项。一般来说,在多变量的协整中可能不止存在一个协整关系。然而,Engle–Granger 方法假设不管有多少个变量都只存在一个协整关系。

一个标准的假设是将协整向量的其中一个系数标准化为1来唯一地识别一组完全共线的协整关系。这种标准化的设定决定了哪些变量会出现在等式左边,而哪些变量会出现在等式右边,显然标准化系数的选择并不会产生实质性影响。以 α = ( 1 , − β ) \alpha=(1,-\beta) α=(1,β) 为例,这意味如下的回归设定:

y t = β x t + e t ( 1 ) y_t=\beta x_t+e_t \qquad (1) yt=βxt+et(1)

上面的等式描述了 y t y_t yt x t x_t xt之间的长期关系,这也被称为“静态”回归因为假设该等式中没有其他变量的动态变化或误差项的序列相关。
OLS 估计量为 β ^ = ∑ i = 1 T y t x t ∑ i = 1 T x t 2 \hat{\beta}=\frac{\sum_{i=1}^{T}{y_{t}x_{t}}}{\sum_{i=1}^{T}{x_{t}^{2}}} β^=i=1Txt2i=1Tyt​<

Stata是一款功能强大的统计分析软件,它能够进行各种统计分析,包括线性回归分析。下面是使用Stata进行线性回归分析的基本步骤: 1. 数据准备:首先,您需要在Stata中准备或导入您的数据。确保数据集中的所有变量都是正确的,并且已经进行了必要的数据清洗。 2. 模型构建:在进行回归分析之前,您需要根据研究目的和数据特性构建回归模型。确定哪些变量是自变量(解释变量),哪些是因变量(响应变量)。 3. 执行回归命令:在Stata中,您可以通过`regress`命令来执行线性回归分析。命令的基本格式如下: ``` regress 因变量 自变量1 自变量2 ... ``` 例如,如果您要分析`income`(收入)作为因变量,而`education`(教育水平)和`experience`(工作经验)作为自变量,您可以输入: ``` regress income education experience ``` 4. 查看结果:执行命令后,Stata会输出回归分析的结果,包括系数估计值、t统计量、P值、R平方值等。这些结果可以帮助您判断模型的拟合程度和各个变量的影响。 5. 解释结果:根据回归分析的输出结果,您可以解释各个自变量的系数对因变量的影响。注意检查变量之间的多重共线性问题,以及模型的其他潜在问题,比如异方差性。 6. 诊断检查:如果需要,进行进一步的诊断,如残差分析、模型假设检验等,以确保回归模型的适用性。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值