十六、平稳序列的决定性
1.非决定性平稳序列
上一篇文章中,讨论了随机变量的最佳线性预测,而时间序列是随机变量构成的序列,我们要考虑的是对时间序列进行预测,而预测用到的历史信息,就来源于时间序列的历史观测。
由于最佳线性预测源自历史与未来的相关性,所以如果想对时间序列进行预测,未来必须与过去存在一定程度的关联,否则预测就没有意义。但是,未来与过去存在的关联程度可能是不一样的,看以下几个例子:
- { X t } : X t = X t − 1 + t \{X_t\}:X_t=X_{t-1}+t {Xt}:Xt=Xt−1+t;
- { Y t } : Y t = ε t \{Y_t\}:Y_t=\varepsilon_t {Yt}:Yt=εt;
- { Z t } : Z t = 0.5 Z t − 1 + ε t \{Z_t\}:Z_t=0.5Z_{t-1}+\varepsilon_t {Zt}:Zt=0.5Zt−1+εt。
这三个例子代表的过去与未来的关联程度是各不相同的,对于 { X t } \{X_t\} {Xt},只要知道 X t − 1 X_{t-1} Xt−1的值就可以直接推出 X t X_t Xt,也就是说 X t = L ( X t ∣ X t − 1 ) X_t=L(X_t|X_{t-1}) Xt=L(Xt∣Xt−1),这种情况下不存在预测误差;对于 { Y t } \{Y_t\} {Yt},不论知道多少历史信息 Y t − 1 , Y t − 2 , ⋯ Y_{t-1},Y_{t-2},\cdots Yt−1,Yt−2,⋯,对 Y t Y_t Yt的预测都没有任何帮助, L ( Y t ∣ Y t − 1 , ⋯ ) = 0 L(Y_t|Y_{t-1},\cdots)=0 L(Yt∣Yt−1,⋯)=0;而第三种情况稍微复杂一些,任意历史信息对未来都会造成一定程度的影响(0.5是影响消退因子),但即便知道所有历史信息,也不可能对未来作出精准预测,因为存在偏差项 ε t \varepsilon_t εt。
鉴于这种区别,我们将平稳序列分为两种,一种是由历史信息可以对未来作出精准预测的,称为决定性平稳序列;另一种是由历史信息不可能完全预测未来的,称之为非决定性平稳序列。
这种定义未免有点粗糙,以下假设平稳序列是零均值的。我们现在假设我们能够获得所有
t
t
t时刻前的历史信息
X
t
,
X
t
−
1
,
⋯
X_t,X_{t-1},\cdots
Xt,Xt−1,⋯,记
X
t
,
m
=
(
X
t
,
X
t
−
1
,
⋯
,
X
t
−
m
+
1
)
m
,
\boldsymbol X_{t,m}=(X_t,X_{t-1},\cdots,X_{t-m+1})_m,
Xt,m=(Xt,Xt−1,⋯,Xt−m+1)m,
这样当
m
→
∞
m\to \infty
m→∞时就代表所有历史信息。精准预测意味着预测不存在误差,也就是方差为0,如果
X
t
X_t
Xt是决定性平稳序列,那么就有
lim
m
→
∞
E
[
X
t
+
1
−
L
(
X
t
+
1
∣
X
t
,
m
)
]
2
=
0.
\lim_{m\to \infty}{\rm E}[X_{t+1}-L(X_{t+1}|\boldsymbol X_{t,m})]^2=0.
m→∞limE[Xt+1−L(Xt+1∣Xt,m)]2=0.
事实上,即使不是决定性平稳序列,这个极限也是存在的,因为随着
m
m
m的增大,这个均方误差会回来越小(因为
m
m
m越大蕴含的信息越多,由最佳线性预测的性质可以得到),也就是单调递减有下界0。正因此,我们将这个极限定义为一步预测的均方误差,这里的下标就是预测步数:
σ
1
2
=
lim
m
→
∞
E
[
X
t
+
1
−
L
(
X
t
+
1
∣
X
t
,
m
)
]
2
.
\sigma^2_1=\lim_{m\to \infty}{\rm E}[X_{t+1}-L(X_{t+1}|\boldsymbol X_{t,m})]^2.
σ12=m→∞limE[Xt+1−L(Xt+1∣Xt,m)]2.
一步预测的均方误差:定义
σ 1 , m 2 = E [ X t + 1 − L ( X t + 1 ∣ X t , m ) ] 2 , \sigma_{1,m}^2={\rm E}[X_{t+1}-L(X_{t+1}|\boldsymbol X_{t,m})]^2, σ1,m2=E[Xt+1−L(Xt+1∣Xt,m)]2,
这表示用 m m m个历史信息对下一个时间点进行预测的均方误差。定义
σ 1 2 = lim m → ∞ σ 1 , m 2 , \sigma_1^2=\lim_{m\to \infty}\sigma^2_{1,m}, σ12=m→∞limσ1,m2,
这表示用全部历史信息对下一个时间点进行预测的均方误差,即一步预测的均方误差。平稳序列的决定性:
- 如果 σ 1 2 = 0 \sigma_1^2=0 σ12=0,就称 { X t } \{X_t\} {Xt}是决定性平稳序列;
- 如果 σ 1 2 > 0 \sigma_1^2>0 σ12>0,就称 { X t } \{X_t\} {Xt}是非决定性平稳序列, σ 1 2 \sigma_1^2 σ12是一步预测的均方误差。
这就是决定性平稳序列的严格定义。注意到以上的符号表示 σ 1 2 , σ 1 , m 2 \sigma_1^2,\sigma_{1,m}^2 σ12,σ1,m2都不含 t t t,尽管在定义时使用了 t t t,这也说明 σ 1 2 , σ 1 , m 2 \sigma_1^2,\sigma_{1,m}^2 σ12,σ1,m2的取值是与 t t t无关的,这一点源自序列的平稳性。
2.平稳序列的长期预测
刚才我们定义了一步预测的均方误差 σ 1 2 \sigma_1^2 σ12,现在转向 k k k步预测,也就是 L ( X t + k ∣ X t , m ) L(X_{t+k}|\boldsymbol X_{t,m}) L(Xt+k∣Xt,m),相应地也可以定义 k k k步预测的均方误差 σ k 2 \sigma_k^2 σk2。
k k k步预测的均方误差:定义
σ k 2 = lim m → ∞ E [ X t + k − L ( X t + k ∣ X t , m ) ] \sigma_k^2=\lim_{m\to \infty}{\rm E}[X_{t+k}-L(X_{t+k}|\boldsymbol X_{t,m})] σk2=m→∞limE[Xt+k−L(Xt+k∣Xt,m)]
为 k k k步预测的均方误差。
这样,可以构建一个新序列
{
σ
1
2
,
σ
1
2
,
⋯
,
σ
k
2
,
⋯
}
\{\sigma_1^2,\sigma_1^2,\cdots,\sigma_k^2,\cdots\}
{σ12,σ12,⋯,σk2,⋯},可以验证
σ
k
2
\sigma_k^2
σk2是关于
k
k
k单调不减少的。直观上想象,随着预测距离的增大,我们能对遥远未来的把控就越小,所以预测的误差肯定会越来越大,实际上也有
σ
k
2
=
lim
m
→
∞
E
[
X
t
+
k
−
L
(
X
t
+
k
∣
X
t
,
⋯
,
X
t
−
m
)
]
2
=
lim
m
→
∞
E
[
X
t
+
k
−
1
−
L
(
X
t
+
k
−
1
∣
X
t
−
1
,
⋯
,
X
t
−
1
−
m
)
]
2
≥
lim
m
→
∞
E
[
X
t
+
k
−
1
−
L
(
X
t
+
k
−
1
∣
X
t
,
⋯
,
X
t
−
1
−
m
)
]
2
=
σ
k
−
1
2
.
\begin{aligned} \sigma_k^2=&\lim_{m\to \infty}{\rm E}[X_{t+k}-L(X_{t+k}|X_t,\cdots,X_{t-m})]^2 \\ =&\lim_{m\to \infty}{\rm E}[X_{t+k-1}-L(X_{t+k-1}|X_{t-1},\cdots,X_{t-1-m})]^2 \\ \ge&\lim_{m\to \infty}{\rm E}[X_{t+k-1}-L(X_{t+k-1}|X_{t},\cdots,X_{t-1-m})]^2\\ =&\sigma_{k-1}^2. \end{aligned}
σk2==≥=m→∞limE[Xt+k−L(Xt+k∣Xt,⋯,Xt−m)]2m→∞limE[Xt+k−1−L(Xt+k−1∣Xt−1,⋯,Xt−1−m)]2m→∞limE[Xt+k−1−L(Xt+k−1∣Xt,⋯,Xt−1−m)]2σk−12.
但是
σ
k
2
\sigma_k^2
σk2也不可能无限增大,因为
σ
k
,
m
2
=
E
[
X
t
+
k
−
L
(
X
t
+
k
∣
X
t
,
m
)
]
2
≤
E
X
t
+
k
2
=
γ
0
\sigma_{k,m}^2={\rm E}[X_{t+k}-L(X_{t+k}|\boldsymbol X_{t,m})]^2\le {\rm E}X_{t+k}^2=\gamma_0
σk,m2=E[Xt+k−L(Xt+k∣Xt,m)]2≤EXt+k2=γ0,因此
{
σ
k
2
}
\{\sigma_k^2\}
{σk2}单调不减有上界,故极限存在,且极限的上界为
γ
0
\gamma_0
γ0。
当然, k → ∞ k\to \infty k→∞时如果 σ k 2 = γ 0 \sigma_k^2=\gamma_0 σk2=γ0,这个预测跟不存在也没有区别了,所以定义纯非决定性平稳序列。
纯非决定性平稳序列:如果对于平稳序列,有
lim k → ∞ σ k 2 = γ 0 , \lim_{k\to\infty}\sigma_k^2=\gamma_0, k→∞limσk2=γ0,
就称 { X t } \{X_t\} {Xt}是纯非决定性的。
刚才我们推知,如果
σ
k
2
→
γ
0
\sigma_k^2\to \gamma_0
σk2→γ0,这个预测与不存在无异,其实也可以证明:
lim
k
→
∞
lim
m
→
∞
E
[
L
(
X
t
+
k
∣
X
t
,
X
t
−
1
,
⋯
,
X
t
−
m
)
]
2
=
0
,
\lim_{k\to \infty}\lim_{m\to \infty}{\rm E}[L(X_{t+k}|X_t,X_{t-1},\cdots,X_{t-m})]^2=0,
k→∞limm→∞limE[L(Xt+k∣Xt,Xt−1,⋯,Xt−m)]2=0,
也就是
L
(
X
t
+
k
∣
X
t
,
⋯
,
X
t
−
m
)
L(X_{t+k}|X_t,\cdots,X_{t-m})
L(Xt+k∣Xt,⋯,Xt−m)随着
k
k
k的增大均方收敛到0,这说明对于非决定性平稳序列,无法做长期预测。
3.决定性平稳序列举例
最简单的决定性平稳序列,是
{
X
t
}
:
X
t
=
ξ
\{X_t\}:X_t=\xi
{Xt}:Xt=ξ,这样,从变量的一个观测值就可以得到全部时间序列。这里,
{
X
t
}
\{X_t\}
{Xt}的二阶协方差矩阵为
Γ
2
=
[
σ
2
σ
2
σ
2
σ
2
]
,
∣
Γ
2
∣
=
0.
\Gamma_2=\begin{bmatrix} \sigma^2 & \sigma^2 \\ \sigma^2 & \sigma^2 \end{bmatrix},|\Gamma_2|=0.
Γ2=[σ2σ2σ2σ2],∣Γ2∣=0.
也就是说,
{
X
t
}
\{X_t\}
{Xt}的二阶协方差矩阵不满秩,正因此,只需要一个历史信息就可以对未来作出精准预测。能否对这个结论进行推广呢?事实上,如果平稳序列
{
X
t
}
\{X_{t}\}
{Xt}的
n
+
1
n+1
n+1阶自协方差矩阵退化,那么这个平稳序列一定是决定性的,且可以由其前
n
n
n个历史信息完全预测。
这是因为,
n
+
1
n+1
n+1阶自协方差矩阵退化,意味着
X
1
,
⋯
,
X
n
+
1
X_1,\cdots,X_{n+1}
X1,⋯,Xn+1必定线性相关;如果再加上
Γ
n
\Gamma_n
Γn满秩的条件,就一定有
X
n
+
1
X_{n+1}
Xn+1可以被
X
1
,
⋯
,
X
n
X_1,\cdots,X_n
X1,⋯,Xn线性表示,这样就有
L
(
X
n
+
1
∣
X
1
,
⋯
,
X
n
)
=
X
n
+
1
,
E
[
X
n
+
1
−
L
(
X
n
+
1
∣
X
1
,
⋯
,
X
n
)
]
2
=
0.
L(X_{n+1}|X_1,\cdots,X_{n})=X_{n+1},\\ {\rm E}[X_{n+1}-L(X_{n+1}|X_1,\cdots,X_n)]^2=0.
L(Xn+1∣X1,⋯,Xn)=Xn+1,E[Xn+1−L(Xn+1∣X1,⋯,Xn)]2=0.
由此推出离散谱序列也是决定性平稳序列。设
E
(
ξ
j
)
=
E
(
η
k
)
=
0
,
E
(
ξ
j
η
k
)
=
0
{\rm E}(\xi_j)={\rm E}(\eta_k)=0,{\rm E}(\xi_j\eta_k)=0
E(ξj)=E(ηk)=0,E(ξjηk)=0,且
E
(
ξ
j
2
)
=
E
(
η
k
2
)
=
σ
j
2
{\rm E}(\xi_j^2)={\rm E}(\eta_k^2)=\sigma^2_j
E(ξj2)=E(ηk2)=σj2,对每一个确定的
j
j
j定义简单谱序列
Z
j
(
t
)
=
ξ
j
cos
(
t
λ
j
)
+
η
j
sin
(
t
λ
j
)
,
t
∈
Z
.
Z_j(t)=\xi_j\cos (t\lambda_j)+\eta_j\sin(t\lambda_j),\quad t\in\Z.
Zj(t)=ξjcos(tλj)+ηjsin(tλj),t∈Z.
显然
Z
j
(
t
)
Z_j(t)
Zj(t)的每一次实现是一个周期函数,其周期
T
=
2
π
/
λ
j
T=2\pi/\lambda_j
T=2π/λj和振幅可以由历史信息决定,实际上它的3阶自协方差矩阵退化,所以
Z
j
(
t
)
Z_j(t)
Zj(t)是决定性的。定义离散谱序列
Z
t
=
∑
j
=
1
p
Z
j
(
t
)
,
t
∈
N
+
,
Z_t=\sum_{j=1}^pZ_j(t),\quad t\in\N^+,
Zt=j=1∑pZj(t),t∈N+,
这时
Z
t
Z_t
Zt的自协方差矩阵也是
2
p
+
1
2p+1
2p+1阶内退化的(所以是决定性的),用到如下引理:
(1)简单离散谱序列:设 E ( ξ ) = E ( η ) = E ( ξ η ) = 0 , E ( ξ 2 ) = E ( η 2 ) = σ 2 , λ 0 ∈ ( 0 , π ] {\rm E}(\xi)={\rm E}(\eta)={\rm E}(\xi\eta)=0,{\rm E}(\xi^2)={\rm E}(\eta^2)=\sigma^2,\lambda_0\in(0,\pi] E(ξ)=E(η)=E(ξη)=0,E(ξ2)=E(η2)=σ2,λ0∈(0,π], { Z t } \{Z_t\} {Zt}的定义为
Z t = ξ cos ( t λ 0 ) + η sin ( t λ 0 ) , t ∈ N , Z_t=\xi\cos(t\lambda_0)+\eta\sin(t\lambda_0),\quad t\in\N, Zt=ξcos(tλ0)+ηsin(tλ0),t∈N,
定义 A = ξ 2 + η 2 , cos θ = ξ / A , sin θ = η / A A=\sqrt{\xi^2+\eta^2},\cos\theta=\xi/A,\sin\theta=\eta/A A=ξ2+η2,cosθ=ξ/A,sinθ=η/A,则
Z t = A cos ( t λ 0 − θ ) , t ∈ N + . Z_t=A\cos(t\lambda_0-\theta),\quad t\in\N^+. Zt=Acos(tλ0−θ),t∈N+.
这样 E Z t = 0 {\rm E}Z_t=0 EZt=0, γ k = σ 2 cos ( k λ 0 ) \gamma_k=\sigma^2\cos (k\lambda_0) γk=σ2cos(kλ0),故 Z t Z_t Zt是一个平稳序列,称为调和平稳序列。并且,这个平稳序列的谱函数是阶梯函数,称之为离散谱序列。(2)多个频率成分的离散谱序列:设 ξ j , η k ( j , k = 1 , 2 , ⋯ , p ) \xi_j,\eta_k(j,k=1,2,\cdots,p) ξj,ηk(j,k=1,2,⋯,p)两两正交,满足上面的条件,对于正整数 p p p和 λ j ∈ ( 0 , π ] \lambda_j\in(0,\pi] λj∈(0,π],定义时间序列
Z t = ∑ i = 1 p [ ξ j cos ( t λ j ) + η j sin ( t λ j ) ] = ∑ j = 1 p A j cos ( t λ j − θ j ) , t ∈ N + , Z_t=\sum_{i=1}^p[\xi_j\cos(t\lambda_j)+\eta_j\sin(t\lambda_j)]=\sum_{j=1}^pA_j\cos(t\lambda_j-\theta_j),\quad t\in\N^+, Zt=i=1∑p[ξjcos(tλj)+ηjsin(tλj)]=j=1∑pAjcos(tλj−θj),t∈N+,
这里 A j = ξ j 2 + η j 2 , cos ( θ j ) = ξ j / A j , sin ( θ j ) = η j / A j A_j=\sqrt{\xi_j^2+\eta_j^2},\cos(\theta_j)=\xi_j/A_j,\sin(\theta_j)=\eta_j/A_j Aj=ξj2+ηj2,cos(θj)=ξj/Aj,sin(θj)=ηj/Aj,它的谱函数也是阶梯函数。(3) Γ n \Gamma_n Γn退化定理:设离散谱序列 { X t } \{X_t\} {Xt}如(2)中定义,如果它的谱函数 F ( λ ) F(\lambda) F(λ)恰有 n n n个跳跃点,则 Γ n \Gamma_n Γn正定, Γ n + 1 \Gamma_{n+1} Γn+1退化;如果 F ( λ ) F(\lambda) F(λ)有无穷多个跳跃点,则 ∀ n ≥ 1 \forall n\ge 1 ∀n≥1, Γ n \Gamma_n Γn正定。
由此,如果 Γ n \Gamma_n Γn退化,就认为 { X n } \{X_n\} {Xn}是离散谱序列,具有周期性。
回顾总结
-
非决定性平稳序列指的是将来信息不能由全部历史信息所确定的平稳序列,更具体的定义是
σ 1 2 = lim m → ∞ σ 1 , m 2 = lim m → ∞ E [ X n + 1 − L ( X n + 1 ∣ X n , m ) ] 2 ≠ 0. \sigma_1^2=\lim_{m\to \infty}\sigma^2_{1,m}=\lim_{m\to \infty}{\rm E}[X_{n+1}-L(X_{n+1}|\boldsymbol X_{n,m})]^2\ne 0. σ12=m→∞limσ1,m2=m→∞limE[Xn+1−L(Xn+1∣Xn,m)]2=0.
否则,称为决定性平稳序列。 -
{ σ k 2 } \{\sigma_k^2\} {σk2}是单调不减有上界的数列,其上界是 γ 0 \gamma_0 γ0,如果 σ k 2 → γ 0 ( k → ∞ ) \sigma_k^2\to \gamma_0(k\to \infty) σk2→γ0(k→∞),则称平稳序列是纯非决定性平稳序列。对于这种平稳序列,进行长期预测是不合适的。
-
如果平稳序列的 n + 1 n+1 n+1阶自协方差矩阵 Γ n + 1 \Gamma_{n+1} Γn+1退化,则矩阵必是 n n n步决定的。