文章目录
协整与误差修正模型
长期均衡与协整分析
经典回归模型是建立在平稳数据变量基础上的。许多经济变量是非平稳的,使用经典回归模型会出现伪回归等诸多问题。但是如果变量之间有着长期的稳定关系,即它们之间是协整的,则可以使用经典回归模型。
长期均衡意味着经济系统不存在破坏均衡的内在机制,如果变量在某时期受到干扰后偏离其长期均衡点,则均衡机制将会在下一期进行调整以使其重新回到均衡状态。
假设
X
X
X 与
Y
Y
Y 之间的长期均衡关系由下式描述:
Y
t
=
α
0
+
α
1
X
t
+
μ
t
.
Y_t=\alpha_0+\alpha_1X_t+\mu_t \ .
Yt=α0+α1Xt+μt .
这个式子对均衡关系的解释为:给定
X
X
X 的一个值,
Y
Y
Y 相应的均衡值也随之确定为
α
0
+
α
1
X
\alpha_0+\alpha_1X
α0+α1X 。
这个式子隐含了一个重要的假设: μ t \mu_t μt 必须是平稳序列。
如果假设不成立,即 μ t \mu_t μt 有上升或下降的随机性趋势。会导致 Y Y Y 对其均衡点的任何偏离被长期累积下来而不能被消除。
在这个假设的基础上,我们称
μ
t
\mu_t
μt 为非均衡误差,它是变量
X
X
X 和
Y
Y
Y 的一个线性组合
μ
t
=
Y
t
−
α
0
−
α
1
X
t
.
\mu_t=Y_t-\alpha_0-\alpha_1X_t \ .
μt=Yt−α0−α1Xt .
如果
X
X
X 与
Y
Y
Y 之间具有长期均衡关系,则
μ
t
\mu_t
μt 应是一零均值平稳时间序列,即零均值
I
(
0
)
{\rm I}(0)
I(0) 序列。
另一方面,非平稳的时间序列 X X X 和 Y Y Y 的线性组合可能成为平稳时间序列,我们称 X X X 和 Y Y Y 是协整的。由此便引出了协整的定义。
协整的定义
如果时间序列 Y t 1 , Y t 2 , . . . , Y t k Y_{t1},Y_{t2},...,Y_{tk} Yt1,Yt2,...,Ytk 都是 d d d 阶单整的,存在向量 α = ( α 1 , α 2 , . . . , α k ) \boldsymbol\alpha=(\alpha_1,\alpha_2,...,\alpha_k) α=(α1,α2,...,αk),使得
Z t = α Y T = α 1 Y t 1 + α 2 Y t 2 + . . . + α k Y t k ∼ I ( d − b ) , d ≥ b ≥ 0 , Z_t=\boldsymbol{\alpha}\boldsymbol{Y}^{\rm T}=\alpha_1Y_{t1}+\alpha_2Y_{t2}+...+\alpha_kY_{tk}\sim {\rm I}(d-b) \ , \ \ \ \ d\geq b\geq 0 \ , Zt=αYT=α1Yt1+α2Yt2+...+αkYtk∼I(d−b) , d≥b≥0 ,
则称序列 Y t 1 , Y t 2 , . . . , Y t k Y_{t1},Y_{t2},...,Y_{tk} Yt1,Yt2,...,Ytk 是 ( d , b ) (d,\,b) (d,b) 阶协整,记为 C I ( d , b ) {\rm CI}(d,\,b) CI(d,b) 。
如果两个变量都是单整变量,只有当它们的单整阶数相同时,才可能协整;如果它们的单整阶数不相同,就不可能协整。
如果存在三个以上的单整变量且具有不同的单整阶数,有可能经过线性组合构成低阶单整变量。
例如: W t ∼ I ( 1 ) W_t\sim{\rm I}(1) Wt∼I(1) , V t ∼ I ( 2 ) V_t\sim{\rm I}(2) Vt∼I(2) , U t ∼ I ( 2 ) U_t\sim{\rm I}(2) Ut∼I(2) ,
若进行以下的线性变换并满足以下条件:
P t = a V t + b U t ∼ I ( 1 ) , P_t=aV_t+bU_t\sim{\rm I}(1) \ , Pt=aVt+bUt∼I(1) ,Q t = c W t + d P t ∼ I ( 0 ) , Q_t=cW_t+dP_t\sim{\rm I}(0) \ , Qt=cWt+dPt∼I(0) ,
则有结论:
V t , U t ∼ C I ( 2 , 1 ) , V_t,\,U_t\sim{\rm CI}(2,\,1) \ , Vt,Ut∼CI(2,1) ,W t , P t ∼ C I ( 1 , 1 ) . W_t,\,P_t\sim{\rm CI}(1,\,1) \ . Wt,Pt∼CI(1,1) .
C I ( d , d ) {\rm CI}(d,\,d) CI(d,d) 的经济意义:两个变量虽然它们具有各自的长期波动规律,但是如果它们是 ( d , d ) (d,d) (d,d) 阶协整的,则它们之间存在着一个长期稳定的比例关系。即使两个时间序列是非平稳的,也可以用经典的回归分析方法建立回归模型。
协整的检验
两变量 Engle-Granger 检验
检验两个呈现 I ( 1 ) {\rm I}(1) I(1) 的变量 y t , x t y_t,\,x_t yt,xt 是否为协整。
step.1 用 OLS 估计如下方程并计算非均衡误差(该回归又被称为协整回归、静态回归):
y
t
=
α
0
+
α
1
x
t
+
μ
t
,
y_t=\alpha_0+\alpha_1x_t+\mu_t \ ,
yt=α0+α1xt+μt ,
得到
e
t
=
y
t
−
y
^
t
=
y
t
−
α
^
0
+
α
^
1
x
t
.
e_t=y_t-\hat{y}_t=y_t-\hat{\alpha}_0+\hat{\alpha}_1x_t \ .
et=yt−y^t=yt−α^0+α^1xt .
step.2 检验
e
t
e_t
et 的平稳性:
如果 e t e_t et 是平稳序列 I ( 0 ) {\rm I}(0) I(0) ,则 y t , x t ∼ C I ( 1 , 1 ) y_t,x_t\sim {\rm CI}(1,1) yt,xt∼CI(1,1), x t x_t xt 与 y t y_t yt 之间存在协整关系;
如果 e t e_t et 是非平稳的,则 x t x_t xt 与 y t y_t yt 之间不存在协整关系。
检验方法:DF 检验或 ADF 检验
Δ
e
t
=
δ
e
t
−
1
+
∑
i
=
1
p
θ
i
Δ
e
t
−
i
+
ε
t
.
\Delta e_t=\delta e_{t-1}+\sum_{i=1}^p\theta_i\Delta e_{t-i}+\varepsilon_t \ .
Δet=δet−1+i=1∑pθiΔet−i+εt .
注意:这里的检验对象是协整回归计算出的误差项,并非真正的非均衡误差。而 OLS 法采用了最小残差平方和的原理,因此估计量
δ
\delta
δ 是向下偏倚的,这将导致拒绝零假设的机会比实际情形大。因此对于
e
t
e_t
et 的平稳性检验的 DF 与 ADF 临界值比正常的 DF 与 ADF 检验的临界值小。
多变量协整关系检验
扩展的 EG 检验
为什么多变量协整关系的检验比双变量复杂?——协整变量间可能存在多种稳定的线性组合。
例如:假设有4个 I ( 1 ) {\rm I}(1) I(1) 的变量 Z , X , Y , W Z,X,Y,W Z,X,Y,W ,它们有如下的长期均衡关系:
Z t = α 0 + α 1 W t + α 2 X t + α 3 Y t + μ t , Z_t=\alpha_0+\alpha_1W_t+\alpha_2X_t+\alpha_3Y_t+\mu_t \ , Zt=α0+α1Wt+α2Xt+α3Yt+μt ,
得到非均衡误差 μ t \mu_t μt 是 I ( 0 ) {\rm I}(0) I(0) 序列
μ t = Z t − α 0 − α 1 W t − α 2 X t − α 3 Y t ∼ I ( 0 ) . \mu_t=Z_t-\alpha_0-\alpha_1W_t-\alpha_2X_t-\alpha_3Y_t\sim{\rm I}(0) \ . μt=Zt−α0−α1Wt−α2Xt−α3Yt∼I(0) .
但存在另一种情况,假设 Z Z Z 与 W W W , X X X 与 Y Y Y 之间分别存在长期均衡关系
Z t = β 0 + β 1 W t + u t , Z_t=\beta_0+\beta_1W_t+u_t \ , Zt=β0+β1Wt+ut ,X t = γ 0 + γ 1 Y t + v t , X_t=\gamma_0+\gamma_1Y_t+v_t \ , Xt=γ0+γ1Yt+vt ,
则非均衡误差项 u t u_t ut 和 v t v_t vt 一定是平稳序列 I ( 0 ) {\rm I}(0) I(0) 。于是它们的线性组合也一定是平稳序列,如:
w t = u t + v t = Z t − β 0 − γ 0 − β 1 W t + X t − γ 1 Y t ∼ I ( 0 ) . w_t=u_t+v_t=Z_t-\beta_0-\gamma_0-\beta_1W_t+X_t-\gamma_1Y_t\sim{\rm I}(0) \ . wt=ut+vt=Zt−β0−γ0−β1Wt+Xt−γ1Yt∼I(0) .
因此存在多组协整向量。
多变量的协整检验步骤:
- 与双变量基本相同,需要检验变量是否具有同阶单整性,以及是否存在稳定的线性组合。
- 在检验是否存在稳定的线性组合时,需要通过设置一个变量为被解释变量,其他变量为解释变量,进行 OLS 估计并检验残差序列是否为平稳序列。如果不平稳则需更换被解释变量,进行同样的 OLS 估计和相应的残差序列的平稳性检验。
- 当所有的变量都被作为被解释变量检验之后,仍不能得到平稳的残差项序列,则认为这些变量间不存在 ( 1 , 1 ) (1,\,1) (1,1) 阶协整。
一般差分模型的问题
对于非平稳时间序列,可以通过差分的方法将其化为稳定序列。
Y
t
=
α
0
+
α
1
X
t
+
μ
t
,
Y_t=\alpha_0+\alpha_1X_t+\mu_t \ ,
Yt=α0+α1Xt+μt ,
Δ Y t = α 1 Δ X t + v t , \Delta Y_t=\alpha_1\Delta X_t+v_t \ , ΔYt=α1ΔXt+vt ,
v t = μ t − μ t − 1 . v_t=\mu_t-\mu_{t-1} \ . vt=μt−μt−1 .
但是这种做法会引起两个问题:
- 如果 X X X 与 Y Y Y 之间存在长期稳定的均衡关系,且误差项 μ t \mu_t μt 不存在序列相关性,则差分式中的 v t v_t vt 是一个一阶移动平均时间序列,因而存在序列相关的问题。
- 如果采用差分形式进行估计,则关于变量水平值的重要信息将被忽略,这时的模型只表达了 X X X 和 Y Y Y 之间的短期关系,而没有揭示它们间的长期关系。
例如,当我们使用 Δ Y t = α 1 Δ X t + v t \Delta Y_t=\alpha_1\Delta X_t+v_t ΔYt=α1ΔXt+vt 进行回归分析时,容易出现截距项显著不为 0 0 0 的情况,即我们得到的估计方程是
Δ Y t = α ^ 0 + α ^ 1 Δ X t + v ^ t , α ^ 0 ≠ 0 . \Delta Y_t=\hat\alpha_0+\hat\alpha_1\Delta X_t+\hat{v}_t\ , \ \ \ \ \hat\alpha_0\neq0 \ . ΔYt=α^0+α^1ΔXt+v^t , α^0=0 .
此时即使保持 X X X 不变, Y Y Y 也会出于长期的上升或下降的过程中,这意味着 X X X 与 Y Y Y 之间不存在静态均衡,与大多数具有长期均衡的经济理论假说不相符。
误差修正模型
假设
X
t
X_t
Xt 与
Y
t
Y_t
Yt 的长期均衡关系为
Y
t
=
α
0
+
α
1
X
t
+
u
t
,
Y_t=\alpha_0+\alpha_1X_t+u_t \ ,
Yt=α0+α1Xt+ut ,
由于现实经济中
X
X
X 与
Y
Y
Y 很少处在均衡点上,因此实际观测到的只是
X
X
X 与
Y
Y
Y 之间的短期或非均衡的关系。假设
X
X
X 与
Y
Y
Y 之间的非均衡关系体现为如下
(
1
,
1
)
(1,\,1)
(1,1) 阶分布滞后模型的形式:
Y
t
=
β
0
+
β
1
X
t
+
β
2
X
t
−
1
+
δ
Y
t
−
1
+
u
t
,
Y_t=\beta_0+\beta_1X_t+\beta_2X_{t-1}+\delta Y_{t-1}+u_t \ ,
Yt=β0+β1Xt+β2Xt−1+δYt−1+ut ,
该模型显示出
t
t
t 期的
Y
Y
Y 不仅与
X
X
X 的变化有关,而且与
t
−
1
t-1
t−1 期的
X
X
X 与
Y
Y
Y 的状态值有关。但由于变量可能具有非平稳性,因此不能直接进行 OLS 估计。
差分变形得
Δ
Y
t
=
β
0
+
β
1
Δ
X
t
+
(
β
1
+
β
2
)
X
t
−
1
−
(
1
−
δ
)
Y
t
−
1
+
u
t
=
β
1
Δ
X
t
−
(
1
−
δ
)
(
Y
t
−
1
−
β
0
1
−
δ
−
β
1
+
β
2
1
−
δ
X
t
−
1
)
+
u
t
≜
β
1
Δ
X
t
−
λ
(
Y
t
−
1
−
α
0
−
α
1
X
t
−
1
)
+
u
t
.
\begin{aligned} \Delta Y_t & = \beta_0+\beta_1\Delta X_t+(\beta_1+\beta_2)X_{t-1}-(1-\delta)Y_{t-1}+u_t \\ \\ &=\beta_1\Delta X_t-(1-\delta)\left(Y_{t-1}-\dfrac{\beta_0}{1-\delta}-\dfrac{\beta_1+\beta_2}{1-\delta}X_{t-1}\right)+u_t \\ \\ &\triangleq \beta_1\Delta X_t-\lambda(Y_{t-1}-\alpha_0-\alpha_1X_{t-1})+u_t \ . \end{aligned}
ΔYt=β0+β1ΔXt+(β1+β2)Xt−1−(1−δ)Yt−1+ut=β1ΔXt−(1−δ)(Yt−1−1−δβ0−1−δβ1+β2Xt−1)+ut≜β1ΔXt−λ(Yt−1−α0−α1Xt−1)+ut .
将上式中的参数与 Y t = α 0 + α 1 X t + u t Y_t=\alpha_0+\alpha_1X_t+u_t Yt=α0+α1Xt+ut 中的相应参数视为相等,则上式中参数 λ \lambda λ 之后的项为 t − 1 t-1 t−1 期的非均衡误差项。这表明 Y Y Y 的短期变化 Δ Y t \Delta Y_t ΔYt 不仅受 X X X 的短期变化 Δ X t \Delta X_t ΔXt 影响,而且根据前一时期的非均衡程度 e c m t − 1 {\rm ecm}_{t-1} ecmt−1 进行相应的修正调整。
误差修正项
e
c
m
{\rm ecm}
ecm :
e
c
m
t
−
1
=
Y
t
−
1
−
(
α
0
+
α
1
X
t
−
1
)
,
{\rm ecm}_{t-1}=Y_{t-1}-(\alpha_0+\alpha_1X_{t-1}) \ ,
ecmt−1=Yt−1−(α0+α1Xt−1) ,
一阶误差修正模型
Δ
Y
t
=
β
1
Δ
X
t
−
λ
⋅
e
c
m
t
−
1
+
u
t
,
\Delta Y_t=\beta_1\Delta X_t-\lambda \cdot {\rm ecm}_{t-1}+u_t \ ,
ΔYt=β1ΔXt−λ⋅ecmt−1+ut ,
一般情况下
∣
δ
∣
<
1
|\delta|<1
∣δ∣<1,有
0
<
λ
<
1
0<\lambda<1
0<λ<1 。
据此分析 ECM 模型的修正作用:
- 若上期的实际值大于长期均衡值,即 Y t − 1 > α 0 + α 1 X t − 1 Y_{t-1}>\alpha_0+\alpha_1X_{t-1} Yt−1>α0+α1Xt−1,则 e c m {\rm ecm} ecm 为正,当期的短期变动 Δ Y t \Delta Y_t ΔYt 减少;
- 若上期的实际值小于长期均衡值,即 Y t − 1 < α 0 + α 1 X t − 1 Y_{t-1}<\alpha_0+\alpha_1X_{t-1} Yt−1<α0+α1Xt−1,则 e c m {\rm ecm} ecm 为负,当期的短期变动 Δ Y t \Delta Y_t ΔYt 增大。
参数的经济意义:
- 长期均衡模型 Y t = α 0 + α 1 X t + u t Y_t=\alpha_0+\alpha_1X_t+u_t Yt=α0+α1Xt+ut 中的 α 1 \alpha_1 α1 可视为 Y Y Y 关于 X X X 的长期弹性;
- 短期非均衡模型 Y t = β 0 + β 1 X t + β 2 X t − 1 + δ Y t − 1 + u t Y_t=\beta_0+\beta_1X_t+\beta_2X_{t-1}+\delta Y_{t-1}+u_t Yt=β0+β1Xt+β2Xt−1+δYt−1+ut 中的 β 1 \beta_1 β1 可视为 Y Y Y 关于 X X X 的短期弹性。
格兰杰表述定理
问题:是否变量间的关系都可以通过 ECM 来表述?
Granger 表述定理:如果变量
X
X
X 与
Y
Y
Y 是协整的,则它们间的短期非均衡关系总能由一个误差修正模型表述。
Δ
Y
t
=
l
a
g
g
e
d
(
Δ
Y
,
Δ
X
)
−
λ
⋅
e
c
m
t
−
1
+
u
t
,
0
<
λ
<
1
.
\Delta Y_t={\rm lagged}(\Delta Y,\,\Delta X)-\lambda\cdot{\rm ecm}_{t-1}+u_t \ , \ \ \ \ 0<\lambda<1 \ .
ΔYt=lagged(ΔY,ΔX)−λ⋅ecmt−1+ut , 0<λ<1 .
其中,
e
c
m
{\rm ecm}
ecm 是非均衡误差项(长期均衡偏差项),
λ
\lambda
λ 是短期调整参数。该模型没有明确指出
Y
Y
Y 和
X
X
X 的滞后阶数,可以包含多阶滞后项。由于一阶差分项是
I
(
0
)
{\rm I}(0)
I(0) 变量,因此模型中允许采用
X
X
X 的非滞后差分项
Δ
X
t
\Delta X_t
ΔXt 。
建立误差修正模型的步骤
首先,对经济系统进行观察和分析,提出长期均衡关系假设。
然后,对变量进行协整分析,以发现变量之间的协整关系,即检验长期均衡关系假设,并以这种关系构成误差修正项。
最后,建立短期模型,将误差修正项看作一个解释变量,连同其他反映短期波动的解释变量一起,建立短期模型,即误差修正模型。
EG 两步法
step.1 利用 OLS 进行协整回归,检验变量间的协整关系,估计协整向量(长期均衡关系参数)
Y
t
=
α
0
+
α
1
X
t
+
u
t
.
Y_t=\alpha_0+\alpha_1X_t+u_t \ .
Yt=α0+α1Xt+ut .
step.2 若协整性存在,则以第一步求得的残差作为非均衡误差项
e
c
m
{\rm ecm}
ecm 加入到误差修正模型中,并用 OLS 估计相应参数
Δ
Y
t
=
l
a
g
g
e
d
(
Δ
Y
,
Δ
X
)
−
λ
⋅
e
c
m
t
−
1
+
u
t
.
\Delta Y_t={\rm lagged}(\Delta Y,\,\Delta X)-\lambda\cdot{\rm ecm}_{t-1}+u_t \ .
ΔYt=lagged(ΔY,ΔX)−λ⋅ecmt−1+ut .
在确定 ECM 模型滞后项阶数时,需要先对模型进行回归,之后检验 ECM 模型的残差是否具有自相关性,或者采用
Q
Q
Q 统计量检验残差是否为白噪声。如果接受了不具有自相关性的零假设,则说明 ECM 模型的滞后阶数选择正确,否则需重新调整参数。
注意:在进行变量间的协整检验时,如有必要可在协整回归式中加入趋势项,这时对残差项的稳定性检验就无须设置趋势项。另外,第二步中变量的差分滞后期数,可以通过残差项序列是否存在自相关性来判断,如果存在自相关,则应加入变量差分后的滞后项。
注意:在实际应用研究中,如果 ECM 中误差修正项参数估计值为正,模型设定肯定是错误的。在实际分析的模型设定中,变量常以对数的形式出现,原因在于变量对数的差分近似地等于该变量的变化率,而经济变量的变化率常常是平稳序列。
直接估计法
打开误差修正模型中非均衡误差项的括号,直接用 OLS 估计模型,以双变量为例
Δ
Y
t
=
β
1
Δ
X
t
−
λ
(
Y
t
−
1
−
α
0
−
α
1
X
t
−
1
)
+
u
t
,
\Delta Y_t=\beta_1\Delta X_t-\lambda(Y_{t-1}-\alpha_0-\alpha_1X_{t-1})+u_t \ ,
ΔYt=β1ΔXt−λ(Yt−1−α0−α1Xt−1)+ut ,
Δ Y t = λ α 0 + β 1 Δ X t − λ Y t − 1 + λ α 1 X t − 1 + u t . \Delta Y_t=\lambda\alpha_0+\beta_1\Delta X_t-\lambda Y_{t-1}+\lambda\alpha_1X_{t-1}+u_t \ . ΔYt=λα0+β1ΔXt−λYt−1+λα1Xt−1+ut .
这时可以一并获得短期弹性和长期弹性的参数估计值,但仍然需要事先对变量间的协整关系进行检验。