1 什么是自相关
1.1 自相关概念
自相关(auto correlation)又称序列相关(serial correlation),即总体回归模型的随机扰动项
μ
i
\mu_i
μi之间存在相关关系。在经典线性回归模型中,无自相关假定为
Cov
(
u
i
,
u
j
)
=
E
(
u
i
,
u
j
)
=
0
(
i
≠
j
)
\operatorname{Cov}\left(u_{i}, u_{j}\right)=E\left(u_{i}, u_{j}\right)=0 \quad(i \neq j)
Cov(ui,uj)=E(ui,uj)=0(i=j)
如果该假定不能满足,就称
μ
i
\mu_i
μi与
μ
j
\mu_j
μj存在自相关,即不同观测点上的误差项彼此相关。随机误差项
μ
t
\mu_t
μt与滞后一期的
μ
t
−
1
\mu_{t-1}
μt−1的自相关系数为
ρ
=
∑
t
=
2
n
u
t
u
t
−
1
∑
t
=
2
n
u
t
2
∑
t
=
2
n
u
t
−
1
2
\rho=\frac{\sum_{t=2}^{n} u_{t} u_{t-1}}{\sqrt{\sum_{t=2}^{n} u_{t}^{2}} \sqrt{\sum_{t=2}^{n} u_{t-1}^{2}}}
ρ=∑t=2nut2∑t=2nut−12∑t=2nutut−1
其中
−
1
<
ρ
<
1
-1<\rho <1
−1<ρ<1,
ρ
\rho
ρ称为一阶自相关系数。
- 当 ρ > 0 \rho >0 ρ>0, μ t \mu_t μt与 μ t − 1 \mu_{t-1} μt−1为正相关;
- 当 ρ < 0 \rho <0 ρ<0, μ t \mu_t μt与 μ t − 1 \mu_{t-1} μt−1为负相关;
- 当 ρ = 0 \rho = 0 ρ=0, μ t \mu_t μt与 μ t − 1 \mu_{t-1} μt−1不相关。
1.2 自相关产生的原因
- 经济系统的惯性,例如通货膨胀不仅受到货币供给的影响,还受到过去通货膨胀的影响
- 经济活动的滞后效应。例如经济学中蛛网模型
- 数据处理造成的相关。
- 模型设定偏误。
1.3 自相关表现形式
样本观测期为
n
n
n的时间序列数据,总体回归模型的随机误差项为
μ
1
,
μ
2
,
…
μ
n
\mu_1,\mu_2,\dots \mu_n
μ1,μ2,…μn,自相关形式为
u
t
=
ρ
u
t
−
1
+
v
t
(1)
u_{t}=\rho u_{t-1}+v_{t} \tag{1}
ut=ρut−1+vt(1)
其中
ρ
\rho
ρ为自相关系数,
v
t
v_t
vt满足古典假设,即
E
(
v
t
)
=
0
E(v_t) = 0
E(vt)=0,
V
a
r
(
v
t
)
=
σ
2
Var(v_t) = \sigma^2
Var(vt)=σ2,
C
o
v
(
v
t
,
v
s
)
=
0
(
t
≠
s
)
Cov(v_t,v_s) = 0(t\ne s)
Cov(vt,vs)=0(t=s)。上述模型包含
μ
t
\mu_t
μt与
μ
t
−
1
\mu_{t-1}
μt−1形式,故称(1)为一阶自回归模型,记作
A
R
(
1
)
AR(1)
AR(1)。若
v
t
v_t
vt中包含
u
t
u_t
ut的成分,则需要从
v
t
v_t
vt中提取
u
t
−
2
u_{t-2}
ut−2,得到
u
t
=
ρ
1
u
t
−
1
+
ρ
2
u
t
−
2
+
v
t
′
(2)
u_{t}=\rho_{1} u_{t-1}+\rho_{2} u_{t-2}+v_{t}^{\prime}\tag{2}
ut=ρ1ut−1+ρ2ut−2+vt′(2)
式中
ρ
1
\rho_1
ρ1为一阶自相关系数,
ρ
2
\rho_2
ρ2为二阶自相关系数,
v
t
′
v_t^{'}
vt′满足古典假设误差项。并将
(
2
)
(2)
(2)称为误差项的二阶自回归,记作
A
R
(
2
)
AR(2)
AR(2)。一般地,若
μ
1
,
μ
2
,
…
μ
n
\mu_1,\mu_2,\dots \mu_n
μ1,μ2,…μn满足
u
t
=
ρ
1
u
t
−
1
+
ρ
2
u
t
−
2
+
⋯
+
ρ
m
u
t
−
m
+
v
t
u_{t}=\rho_{1} u_{t-1}+\rho_{2} u_{t-2}+\cdots+\rho_{m} u_{t-m}+v_{t}
ut=ρ1ut−1+ρ2ut−2+⋯+ρmut−m+vt
其中
v
t
v_t
vt为古典假设误差项,
ρ
i
(
i
=
1
,
2
,
…
m
)
\rho_i(i = 1,2,\dots m)
ρi(i=1,2,…m)为
i
i
i阶自回归系数。
2 自相关后果
自相关与异方差均不服从球形扰动项假设,故自相关的的后果与异方差相同。以一元回归模型为例
Y
t
=
β
1
+
β
2
X
t
+
u
t
Y_{t}=\beta_{1}+\beta_{2} X_{t}+u_{t}
Yt=β1+β2Xt+ut
其中
μ
t
\mu_t
μt存在一阶自相关,即
u
t
=
ρ
u
t
−
1
+
v
t
u_{t}=\rho u_{t-1}+v_{t}
ut=ρut−1+vt,其中
E
(
v
t
)
=
0
E(v_t) = 0
E(vt)=0,
V
a
r
(
v
t
)
=
σ
2
Var(v_t) = \sigma^2
Var(vt)=σ2,
C
o
v
(
v
t
,
v
s
)
=
0
(
t
≠
s
)
Cov(v_t,v_s) = 0(t\ne s)
Cov(vt,vs)=0(t=s)。在大样本条件下,
ρ
\rho
ρ的估计量为
ρ
^
=
∑
u
t
u
t
−
1
∑
u
t
−
1
2
\hat{\rho}=\frac{\sum u_{t} u_{t-1}}{\sum u_{t-1}^{2}}
ρ^=∑ut−12∑utut−1
在大样本条件下,
μ
t
\mu_t
μt与
μ
t
−
1
\mu_{t-1}
μt−1的相关系数为
ρ
=
∑
u
t
u
t
−
1
∑
u
t
2
∑
u
t
−
1
2
≈
∑
u
t
u
t
−
1
∑
u
t
−
1
2
=
ρ
^
\rho=\frac{\sum u_{t} u_{t-1}}{\sqrt{\sum u_{t}^{2}} \sqrt{\sum u_{t-1}^{2}}} \approx \frac{\sum u_{t} u_{t-1}}{\sum u_{t-1}^{2}}=\hat{\rho}
ρ=∑ut2∑ut−12∑utut−1≈∑ut−12∑utut−1=ρ^
由(1)式迭代得
u
t
=
v
t
+
ρ
v
t
−
1
+
ρ
2
v
t
−
2
+
⋯
=
∑
r
=
0
∞
ρ
r
v
t
−
r
(3)
u_{t}=v_{t}+\rho v_{t-1}+\rho^{2} v_{t-2}+\cdots=\sum_{r=0}^{\infty} \rho^{r} v_{t-r}\tag{3}
ut=vt+ρvt−1+ρ2vt−2+⋯=r=0∑∞ρrvt−r(3)
式表明,误差项可以由服从独立同分布(
i
i
d
iid
iid)的随机误差序列
v
t
−
r
(
r
=
1
,
2
,
…
)
v_{t-r}(r=1,2,\dots)
vt−r(r=1,2,…)表示,其中权重为
ρ
r
(
r
=
1
,
2
,
…
)
\rho^r(r= 1,2,\dots)
ρr(r=1,2,…)。当
ρ
∈
(
0
,
1
)
\rho\in(0,1)
ρ∈(0,1)时表明权数为几何递减,当
ρ
∈
(
−
1
,
0
)
\rho \in(-1,0)
ρ∈(−1,0)时表明权数为震荡交错衰减。
μ
t
\mu_t
μt的期望与方差为
E
(
u
t
)
=
∑
r
=
0
∞
ρ
r
E
(
v
t
−
r
)
=
0
E\left(u_{t}\right)=\sum_{r=0}^{\infty} \rho^{r} E\left(v_{t-r}\right)=0
E(ut)=r=0∑∞ρrE(vt−r)=0
Var
(
u
t
)
=
∑
r
=
0
∞
ρ
2
n
Var
(
v
t
−
r
)
=
σ
v
2
1
−
ρ
2
=
σ
u
2
\operatorname{Var}\left(u_{t}\right)=\sum_{r=0}^{\infty} \rho^{2 n} \operatorname{Var}\left(v_{t-r}\right)=\frac{\sigma_{v}^{2}}{1-\rho^{2}}=\sigma_{u}^{2}
Var(ut)=r=0∑∞ρ2nVar(vt−r)=1−ρ2σv2=σu2
当存在自相关时,扰动项的期望值为0,同方差。但方差协方差矩阵非对角线元素,即扰动项的协方差为
Cov
(
u
t
,
u
t
−
k
)
=
ρ
k
Var
(
u
t
−
k
)
=
ρ
k
σ
v
2
1
−
ρ
2
≠
0
\operatorname{Cov}\left(u_{t}, u_{t-k}\right)=\rho^{k} \operatorname{Var}\left(u_{t-k}\right)=\frac{\rho^{k} \sigma_{v}^{2}}{1-\rho^{2}}\ne 0
Cov(ut,ut−k)=ρkVar(ut−k)=1−ρ2ρkσv2=0
当
k
=
1
k= 1
k=1时称为扰动项
μ
t
\mu_t
μt一阶协方差,
k
=
n
k = n
k=n称为扰动项
μ
t
\mu_t
μt的
n
n
n阶协方差。
2.1 对估计参数的影响
一元线性回归模型在满足经典假设条件下,斜率估计量为
Var
(
β
^
2
)
=
σ
2
∑
x
t
2
(4)
\operatorname{Var}\left(\hat{\beta}_{2}\right)=\frac{\sigma^{2}}{\sum x_{t}^{2}}\tag{4}
Var(β^2)=∑xt2σ2(4)
存在自相关时,估量的期望
E
(
β
^
2
)
=
β
2
E(\hat{\beta}_2) = \beta_2
E(β^2)=β2,即无偏。但估量的方差推导过程利用了无自相关假设,即
E
(
u
i
,
u
j
)
=
0
(
i
≠
j
)
E\left(u_{i}, u_{j}\right)=0 \quad(i \neq j)
E(ui,uj)=0(i=j),于是
Var
(
β
^
2
)
≠
σ
2
∑
x
t
2
\operatorname{Var}\left(\hat{\beta}_{2}\right)\ne \frac{\sigma^{2}}{\sum x_{t}^{2}}
Var(β^2)=∑xt2σ2
可以证明,当随机扰动项
μ
t
\mu_t
μt存在一阶自相关时,估计量的方差为
Var
(
β
^
2
)
=
σ
u
2
∑
t
=
1
n
x
t
2
(
1
+
2
ρ
∑
t
=
1
n
−
1
x
t
x
t
+
1
∑
t
=
1
n
x
t
2
+
2
ρ
2
∑
t
=
1
n
−
2
x
t
x
t
+
2
∑
t
=
1
n
x
t
2
+
⋯
+
2
ρ
n
−
1
x
1
x
n
∑
t
=
1
n
x
t
2
)
(5)
\operatorname{Var}\left(\hat{\beta}_{2}\right)=\frac{\sigma_{u}^{2}}{\sum_{t=1}^{n} x_{t}^{2}}\left(1+2 \rho \frac{\sum_{t=1}^{n-1} x_{t} x_{t+1}}{\sum_{t=1}^{n} x_{t}^{2}}+2 \rho^{2} \frac{\sum_{t=1}^{n-2} x_{t} x_{t+2}}{\sum_{t=1}^{n} x_{t}^{2}}+\cdots+2 \rho^{n-1} \frac{x_{1} x_{n}}{\sum_{t=1}^{n} x_{t}^{2}}\right) \tag{5}
Var(β^2)=∑t=1nxt2σu2(1+2ρ∑t=1nxt2∑t=1n−1xtxt+1+2ρ2∑t=1nxt2∑t=1n−2xtxt+2+⋯+2ρn−1∑t=1nxt2x1xn)(5)
当
ρ
=
0
\rho = 0
ρ=0,此时
Var
(
β
^
2
)
=
σ
2
/
∑
x
t
2
\operatorname{Var}\left(\hat{\beta}_{2}\right)=\sigma^2/\sum x_{t}^{2}
Var(β^2)=σ2/∑xt2。不难看出,(5)的方差大于(4)式的方差,故在自相关条件下,估计量
Var
(
β
^
2
)
\operatorname{Var}\left(\hat{\beta}_{2}\right)
Var(β^2)不再是最小的。方差增大,回归系数的标准误增大。当存在自相关时,容易证明,
E
(
∑
e
t
2
)
=
σ
2
[
(
n
−
2
)
−
(
2
ρ
∑
X
t
X
t
+
1
∑
X
t
2
+
2
ρ
2
∑
X
t
X
t
+
2
∑
X
t
2
+
⋯
+
2
ρ
n
−
1
∑
X
t
X
n
∑
X
t
2
)
]
(6)
E\left(\sum e_{t}^{2}\right)=\sigma^{2}\left[(n-2)-\left(2 \rho \frac{\sum X_{t} X_{t+1}}{\sum X_{t}^{2}}+2 \rho^{2} \frac{\sum X_{t} X_{t+2}}{\sum X_{t}^{2}}+\cdots+2 \rho^{n-1} \frac{\sum X_{t} X_{n}}{\sum X_{t}^{2}}\right)\right]\tag{6}
E(∑et2)=σ2[(n−2)−(2ρ∑Xt2∑XtXt+1+2ρ2∑Xt2∑XtXt+2+⋯+2ρn−1∑Xt2∑XtXn)](6)
当
X
t
X_t
Xt与
μ
t
\mu_t
μt为正相关时,(6)式
E
(
∑
e
t
2
)
E\left(\sum e_{t}^{2}\right)
E(∑et2)与
σ
2
^
=
∑
e
t
2
/
(
n
−
2
)
\hat{\sigma^2} = \sum e_{t}^{2}/(n-2)
σ2^=∑et2/(n−2)相比降低,进而低估了真实的
σ
2
\sigma^2
σ2,最终低估了(4)式的方差。
2.2 对模型检验的影响
自相关问题将低估参数的方差((5)与(6)表现),根据系数检验统计量 t = ( β ^ 2 − β 2 ) / SE ( β ^ 2 ) ∼ t ( n − 2 ) t=\left(\hat{\beta}_{2}-\beta_{2}\right) / \operatorname{SE}\left(\hat{\beta}_{2}\right) \sim t(n-2) t=(β^2−β2)/SE(β^2)∼t(n−2), t t t统计量被夸大,显著性夸大。类似的,模型显著性检验以及拟合优度也是不可靠的。模型预测方面,其预测精度降低,预测置信区间扩大。
3自相关检验
3.1相关图示法
-
e t e_t et与 e t − 1 e_{t-1} et−1散点图:根据残差 e t e_t et与 e t − 1 e_{t-1} et−1的走势判断正相关还是负相关
-
e t e_t et与 t t t散点图:如果 e t e_t et随着时间的变化频繁地变化符号,说明 e t e_t et存在负自相关;几个正的 e t e_t et跟着几个负的 e t e_t et,表明 e t e_t et存在正相关。
3.2 DW检验
DW检验是J.Durbin(杜宾)和G.S.Watson(沃特森)于1951 年提出的一种适用于小样本的检验方法。DW检验的条件为
-
自变量 X X X非随机
-
随机误差仅为一阶自相关,即 u t = ρ u t − 1 + v t u_{t}=\rho u_{t-1}+v_{t} ut=ρut−1+vt(不能处理高阶自相关情形)
-
线性模型不包含被解释变量滞后项(不能处理动态模型情形)
-
模型必须存在截距项
-
数据无缺失项
定义DW统计量
D
W
=
∑
t
=
2
n
(
e
t
−
e
t
−
1
)
2
∑
t
=
1
n
e
t
2
D W=\frac{\sum_{t=2}^{n}\left(e_{t}-e_{t-1}\right)^{2}}{\sum_{t=1}^{n} e_{t}^{2}}
DW=∑t=1net2∑t=2n(et−et−1)2
其中
e
t
=
Y
t
−
Y
^
t
e_t = Y_t-\hat{Y}_t
et=Yt−Y^t
(
t
=
1
,
2
,
…
n
)
(t=1,2,\dots n)
(t=1,2,…n),将DW统计量展开,在大样本条件下
∑
t
=
2
n
e
t
2
≈
∑
t
=
2
n
e
t
−
1
2
≈
∑
t
=
1
n
e
t
2
\sum_{t=2}^{n} e_{t}^{2} \approx \sum_{t=2}^{n} e_{t-1}^{2} \approx \sum_{t=1}^{n} e_{t}^{2}
∑t=2net2≈∑t=2net−12≈∑t=1net2,则
D
W
≈
2
[
1
−
∑
i
=
2
n
e
t
e
t
−
1
∑
t
=
1
n
e
t
2
]
D W \approx 2\left[1-\frac{\sum_{i=2}^{n} e_{t} e_{t-1}}{\sum_{t=1}^{n} e_{t}^{2}}\right]
DW≈2[1−∑t=1net2∑i=2netet−1]
同理,在
∑
t
=
2
n
e
t
2
≈
∑
t
=
2
n
e
t
−
1
2
≈
∑
t
=
1
n
e
t
2
\sum_{t=2}^{n} e_{t}^{2} \approx \sum_{t=2}^{n} e_{t-1}^{2} \approx \sum_{t=1}^{n} e_{t}^{2}
∑t=2net2≈∑t=2net−12≈∑t=1net2条件下,
ρ
^
≈
∑
t
=
2
n
e
t
e
t
−
1
∑
t
=
1
n
e
t
2
\hat{\rho} \approx \frac{\sum_{t=2}^{n} e_{t} e_{t-1}}{\sum_{t=1}^{n} e_{t}^{2}}
ρ^≈∑t=1net2∑t=2netet−1
从而有
D
W
≈
2
(
1
−
ρ
^
)
DW \approx 2(1-\hat{\rho})
DW≈2(1−ρ^)
由于
−
1
<
ρ
^
<
1
-1<\hat{\rho}<1
−1<ρ^<1,故
0
≤
D
W
≤
4
0\le DW\le 4
0≤DW≤4。根据样本容量
n
n
n、解释变量个数
k
′
k'
k′(不包括常数),查DW分布表可得临界值
d
L
,
d
U
d_L,d_U
dL,dU,然后依据以下规则考察
D
W
DW
DW值
-
0 ≤ D W ≤ d L 0\le DW \le d_L 0≤DW≤dL,误差项 μ i \mu_i μi存在正相关
-
d L ≤ D W ≤ d U d_L\le DW \le d_U dL≤DW≤dU,无法判断
-
d U ≤ D W ≤ 4 − d U d_U \le DW \le 4-d_U dU≤DW≤4−dU,无自相关
-
4 − d U ≤ D W ≤ 4 − d L 4-d_U \le DW \le 4-d_L 4−dU≤DW≤4−dL,无法判断
-
4 − d L ≤ D W ≤ 4 4-d_L\le DW \le 4 4−dL≤DW≤4,误差项 μ i \mu_i μi存在负相关
显然,当DW值接近0时,存在正相关,接近4时存在负相关,接近2时,不存在相关。注意:DW存在无法判断区域。
3.3 DW检验局限
-
DW统计量具有前置条件
-
DW检验上下界要求样本容量 n ≥ 15 n\ge 15 n≥15
-
DW检验不适用于随机误差的高阶相关
-
DW检验存在两个未知区域不能判定
4 自相关补救
4.1 广义差分法
一元线性回归模型
Y
t
=
β
1
+
β
2
X
t
+
u
t
(7)
Y_{t}=\beta_{1}+\beta_{2} X_{t}+u_{t}\tag{7}
Yt=β1+β2Xt+ut(7)
随机扰动项
u
t
=
ρ
u
t
−
1
+
v
t
u_{t}=\rho u_{t-1}+v_{t}
ut=ρut−1+vt,
∣
ρ
∣
<
1
|\rho|<1
∣ρ∣<1,
v
t
v_t
vt满足经典假设条件。将(7)滞后一期为
Y
t
−
1
=
β
1
+
β
2
X
t
−
1
+
u
t
−
1
(8)
Y_{t-1}=\beta_{1}+\beta_{2} X_{t-1}+u_{t-1}\tag{8}
Yt−1=β1+β2Xt−1+ut−1(8)
将(8)乘以相关系数
ρ
\rho
ρ并用(7)减之,得
Y
t
−
ρ
Y
t
−
1
=
β
1
(
1
−
ρ
)
+
β
2
(
X
t
−
ρ
X
t
−
1
)
+
u
t
−
ρ
u
t
−
1
Y_{t}-\rho Y_{t-1}=\beta_{1}(1-\rho)+\beta_{2}\left(X_{t}-\rho X_{t-1}\right)+u_{t}-\rho u_{t-1}
Yt−ρYt−1=β1(1−ρ)+β2(Xt−ρXt−1)+ut−ρut−1
其中
v
t
=
u
t
−
ρ
u
t
−
1
v_t =u_{t}-\rho u_{t-1}
vt=ut−ρut−1满足经典假设条件,无自相关。令
Y
t
∗
=
Y
t
−
ρ
Y
t
−
1
Y_{t}^{*}=Y_{t}-\rho Y_{t-1}
Yt∗=Yt−ρYt−1 ,
X
t
∗
=
X
t
−
ρ
X
t
−
1
X_{t}^{*}=X_{t}-\rho X_{t-1}
Xt∗=Xt−ρXt−1,
β
1
∗
=
β
1
(
1
−
ρ
)
\beta_{1}^{*}=\beta_{1}(1-\rho)
β1∗=β1(1−ρ),
β
2
=
β
2
∗
\beta_{2}=\beta_{2}^{*}
β2=β2∗,得到
Y
t
∗
=
β
1
∗
+
β
2
∗
X
t
∗
+
v
t
(9)
Y_{t}^{*}=\beta_{1}^{*}+\beta_{2}^{*} X_{t}^{*}+v_{t}\tag{9}
Yt∗=β1∗+β2∗Xt∗+vt(9)
对(9)使用OLS得到参数最佳线性无偏估计量。由于广义差分失去了第一个观测值,一般使用
Y
1
1
−
ρ
2
Y_1\sqrt{1-\rho^2}
Y11−ρ2与
X
1
1
−
ρ
2
X_1\sqrt{1-\rho^2}
X11−ρ2作为相应得补充。
4.2 Cochrane—Orcutt迭代法
ρ
\rho
ρ一般未知,最简单得方法时通过DW计算,即
ρ
^
≈
1
−
D
W
2
\hat{\rho}\approx1-\frac{DW}{2}
ρ^≈1−2DW
但该方法较为粗略。一种精确度较高得方法是Cochrane—Orcutt迭代法。步骤如下
-
使用OLS估计模型 Y t = β 1 + β 2 X t + u t Y_{t}=\beta_{1}+\beta_{2} X_{t}+u_{t} Yt=β1+β2Xt+ut,并计算残差 e t ( 1 ) e_t^{(1)} et(1)
-
利用残差 e t ( 1 ) e_t^{(1)} et(1)作如下回归
e t ( 1 ) = ρ ^ ( 1 ) e t − 1 ( 1 ) + v t e_{t}^{(1)}=\hat{\rho}^{(1)} e_{t-1}^{(1)}+v_{t} et(1)=ρ^(1)et−1(1)+vt -
利用上步计算的 ρ ^ ( 1 ) \hat{\rho}^{(1)} ρ^(1)对模型 Y t = β 1 + β 2 X t + u t Y_{t}=\beta_{1}+\beta_{2} X_{t}+u_{t} Yt=β1+β2Xt+ut作广义差分,令 Y t ∗ = Y t − ρ ^ ( 1 ) Y t − 1 Y_{t}^{*}=Y_{t}-\hat{\rho}^{(1)} Y_{t-1} Yt∗=Yt−ρ^(1)Yt−1, X t ∗ = X t − ρ ^ ( 1 ) X t − 1 X_{t}^{*}=X_{t}-\hat{\rho}^{(1)} X_{t-1} Xt∗=Xt−ρ^(1)Xt−1, β 1 ∗ = β 1 ( 1 − ρ ^ ( 1 ) ) \beta_{1}^{*}=\beta_{1}\left(1-\hat{\rho}^{(1)}\right) β1∗=β1(1−ρ^(1)),从而得到样本回归函数
Y t ∗ = β 1 ∗ + β 2 ∗ X t ∗ + e t ( 2 ) Y_{t}^{*}=\beta_{1}^{*}+\beta_{2}^{*} X_{t}^{*}+e_t^{(2)} Yt∗=β1∗+β2∗Xt∗+et(2) -
利用 β ^ 1 = β ^ 1 ∗ / ( 1 − ρ ^ ( 1 ) ) \hat{\beta}_{1}=\hat{\beta}_{1}^{*} /\left(1-\hat{\rho}^{(1)}\right) β^1=β^1∗/(1−ρ^(1))与 β ^ 2 = β ^ 2 ∗ \hat{\beta}_2=\hat{\beta}_2^{*} β^2=β^2∗,将 β ^ 1 , β ^ 2 \hat{\beta}_{1},\hat{\beta}_{2} β^1,β^2代入原回归模型得新的残差 e t ( 3 ) e_t^{(3)} et(3)
e t ( 3 ) = Y t − β 1 − β 2 X t e_{t}^{(3)}=Y_{t}-\beta_{1}-\beta_{2} X_{t} et(3)=Yt−β1−β2Xt -
利用残差 e t ( 3 ) e_t^{(3)} et(3)作回归
e t ( 3 ) = ρ ( 2 ) e t − 1 ( 3 ) + v t e_{t}^{(3)}=\rho^{(2)} e_{t-1}^{(3)}+v_{t} et(3)=ρ(2)et−1(3)+vt
用 OLS法估计的 ρ ^ ( 2 ) \hat{\rho}^{(2)} ρ^(2)是对 ρ \rho ρ的第二轮估计值。给定误差项 δ \delta δ,当 ∣ ρ ^ k − ρ ^ k − 1 ∣ < δ |\hat{\rho}^{k}-\hat{\rho}^{k-1}|<\delta ∣ρ^k−ρ^k−1∣<δ时,停止迭代。
4.3 差分法
使用条件:完全正自相关,即
ρ
=
1
\rho =1
ρ=1。设一阶线性回归模型
Y
t
=
β
1
+
β
2
X
t
+
u
t
Y_{t}=\beta_{1}+\beta_{2} X_{t}+u_{t}
Yt=β1+β2Xt+ut,
u
t
=
ρ
u
t
−
1
+
v
t
u_{t}=\rho u_{t-1}+v_{t}
ut=ρut−1+vt。将模型滞后一期并作差分得到
Δ
Y
t
=
β
2
Δ
X
t
+
u
t
−
u
t
−
1
\Delta Y_{t}=\beta_{2} \Delta X_{\mathrm{t}}+u_{t}-u_{t-1}
ΔYt=β2ΔXt+ut−ut−1
此时扰动项
v
t
=
u
t
−
u
t
−
1
v_t = u_t-u_{t-1}
vt=ut−ut−1满足经典假设条件。从而消除自相关。但这种方法假定了扰动项存在完全正自相关,不具有推广性。
4.4 德宾两步法
自相关系数
ρ
\rho
ρ未知,可用德宾两步法消除自相关。将广义差分模型变形得到
Y
t
=
β
1
(
1
−
ρ
)
+
β
2
X
t
−
ρ
β
2
X
t
−
1
+
ρ
Y
t
−
1
+
v
t
Y_{t}=\beta_{1}(1-\rho)+\beta_{2} X_{t}-\rho \beta_{2} X_{t-1}+\rho Y_{t-1}+v_{t}
Yt=β1(1−ρ)+β2Xt−ρβ2Xt−1+ρYt−1+vt
-
将上式视为多元线性回归模型,利用ols法得到 ρ ^ \hat{\rho} ρ^,视为参数 ρ \rho ρ得估计,但却时有偏但一致得估计。
-
利用 ρ ^ \hat{\rho} ρ^进行广义差分求出序列 Y t ∗ = Y t − ρ Y t − 1 Y_{t}^{*}=Y_{t}-\rho Y_{t-1} Yt∗=Yt−ρYt−1 , X t ∗ = X t − ρ X t − 1 X_{t}^{*}=X_{t}-\rho X_{t-1} Xt∗=Xt−ρXt−1, 然后使用olsOLS对广义差分进行估计,求得最佳线性无偏估计。
参考文献
庞皓. 计量经济学[M].科学出版社