时间序列 · 平稳序列
时间序列的定义
时间序列是按照时间次序排列的随机变量序列。任何时间序列经过合理的函数变换后都可以被认为是由三个部分叠加而成的:趋势项部分、周期项部分和随机噪声项部分。
X
t
=
T
t
+
S
t
+
R
t
,
t
=
1
,
2
,
.
.
.
X_t=T_t+S_t+R_t \ , \ \ \ \ t=1,2,...
Xt=Tt+St+Rt , t=1,2,...
时间序列在适当的去掉趋势项和季节项后,剩下的随机部分通常会有某种平稳性。带有平稳性的时间序列是时间序列分析研究的重点。于是,引出平稳序列的相关概念和性质。
平稳序列的定义
对于独立时间序列 { X t } \{X_t\} {Xt} , ( X 1 , X 2 , . . . , X n ) (X_1,X_2,...,X_n) (X1,X2,...,Xn) 和 X n + 1 X_{n+1} Xn+1 独立,从而不会含有任何关于 X n + 1 X_{n+1} Xn+1 的信息。平稳时间序列的历史记录 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn 中往往含有 X n + 1 X_{n+1} Xn+1 的信息,这就使得利用历史样本预测将来成为可能。
如果时间序列 { X t } \{X_t\} {Xt} 满足
(1) 对任何 t ∈ N t\in\N t∈N , E ( X t 2 ) < ∞ {\rm E}(X_t^2)<\infty E(Xt2)<∞ ;
(2) 对任何 t ∈ N t\in\N t∈N , E ( X t ) = μ {\rm E}(X_t)=\mu E(Xt)=μ ;
(3) 对任何 t , s ∈ N t,\,s\in\N t,s∈N , E [ ( X t − μ ) ( X s − μ ) ] = γ t − s {\rm E}[(X_t-\mu)(X_s-\mu)]=\gamma_{t-s} E[(Xt−μ)(Xs−μ)]=γt−s
就称 { X t } \{X_t\} {Xt} 是平稳时间序列,称实数列 { γ k } \{\gamma_k\} {γk} 为 { X t } \{X_t\} {Xt} 的自协方差函数。
平稳序列中的随机变量 X t X_t Xt 的均值和方差都是与 t t t 无关的常数。
对任何
t
,
s
∈
Z
t,\,s\in\Z
t,s∈Z 和
k
∈
Z
k\in\Z
k∈Z ,
(
X
t
,
X
s
)
(X_t,\,X_s)
(Xt,Xs) 和平移
k
k
k 步后的
(
X
t
+
k
,
X
s
+
k
)
(X_{t+k},\,X_{s+k})
(Xt+k,Xs+k) 有相同的协方差:
C
o
v
(
X
t
,
X
s
)
=
C
o
v
(
X
t
+
k
,
X
s
+
k
)
=
γ
t
−
s
{\rm Cov}(X_t,\,X_s)={\rm Cov}(X_{t+k},\,X_{s+k})=\gamma_{t-s}
Cov(Xt,Xs)=Cov(Xt+k,Xs+k)=γt−s
即平稳序列的任意两个随机变量的协方差只与时间差有关,称为协方差结构的平移不变性。
时间序列分析的重要特点之一是利用自协方差函数研究平稳序列的统计性质,因此需要对 { γ k } \{\gamma_k\} {γk} 的性质进行探讨。
自协方差函数满足以下三条基本性质:
(1) 对称性: γ k = γ − k \gamma_k=\gamma_{-k} γk=γ−k ,对所有 k ∈ Z k\in\Z k∈Z 成立;
(2) 非负定性:对任何 n ∈ N + n\in\N_+ n∈N+ , n n n 阶自协方差矩阵
Γ n = ( γ k − j ) k , j = 1 n = [ γ 0 γ 1 ⋯ γ n − 1 γ 1 γ 0 ⋯ γ n − 2 ⋮ ⋮ ⋮ γ n − 1 γ n − 2 ⋯ γ 0 ] \boldsymbol{\Gamma}_n=(\gamma_{k-j})_{k,\,j=1}^n=\left[ \begin{array}{cccc} \gamma_0 & \gamma_1 & \cdots & \gamma_{n-1} \\ \gamma_1 & \gamma_0 & \cdots & \gamma_{n-2} \\ \vdots & \vdots & & \vdots \\ \gamma_{n-1} & \gamma_{n-2} & \cdots & \gamma_0 \\ \end{array} \right] Γn=(γk−j)k,j=1n=⎣⎢⎢⎢⎡γ0γ1⋮γn−1γ1γ0⋮γn−2⋯⋯⋯γn−1γn−2⋮γ0⎦⎥⎥⎥⎤
是非负定矩阵;(3) 有界性: ∣ γ k ∣ ≤ γ 0 |\gamma_k|\leq\gamma_0 ∣γk∣≤γ0 ,对所有 k ∈ Z k\in\Z k∈Z 成立。
任何满足上述性质的实数列都被称为非负定序列。
平稳序列的自协方差函数是非负定序列,每个非负定序列都可以是一个平稳序列的自协方差函数。
性质 (1) 的证明:由定义直接得到。
性质 (2) 的证明:任取一个
n
n
n 维实向量
a
n
=
(
a
1
,
a
2
,
.
.
.
,
a
n
)
T
\boldsymbol{a}_n=(a_1,a_2,...,a_n)^{\rm T}
an=(a1,a2,...,an)T ,
a
n
T
Γ
n
a
n
=
∑
i
=
1
n
∑
j
=
1
n
a
i
a
j
γ
i
−
j
=
∑
i
=
1
n
∑
j
=
1
n
a
i
a
j
E
[
(
X
i
−
μ
)
(
X
i
−
μ
)
]
=
E
(
∑
i
=
1
n
∑
j
=
1
n
a
i
a
j
(
X
i
−
μ
)
(
X
i
−
μ
)
)
=
E
(
∑
i
=
1
n
a
i
(
X
i
−
μ
)
)
2
=
V
a
r
(
∑
i
=
1
n
a
i
(
X
i
−
μ
)
)
≥
0.
\begin{aligned} \boldsymbol{a}_n^{\rm T}\boldsymbol{\Gamma}_n\boldsymbol{a}_n &=\sum_{i=1}^n\sum_{j=1}^na_ia_j\gamma_{i-j} \\ &=\sum_{i=1}^n\sum_{j=1}^na_ia_j{\rm E}[(X_{i}-\mu)(X_{i}-\mu)] \\ &={\rm E}\left(\sum_{i=1}^n\sum_{j=1}^na_ia_j(X_{i}-\mu)(X_{i}-\mu)\right) \\ &={\rm E}\left(\sum_{i=1}^na_i(X_i-\mu)\right)^2 \\ &={\rm Var}\left(\sum_{i=1}^na_i(X_i-\mu)\right)\geq0 . \end{aligned}
anTΓnan=i=1∑nj=1∑naiajγi−j=i=1∑nj=1∑naiajE[(Xi−μ)(Xi−μ)]=E(i=1∑nj=1∑naiaj(Xi−μ)(Xi−μ))=E(i=1∑nai(Xi−μ))2=Var(i=1∑nai(Xi−μ))≥0.
性质 (3) 的证明:需要利用柯西不等式。
首先对随机变量进行中心化,取 Y t = X t − μ Y_t=X_t-\mu Yt=Xt−μ ,以后常假设均值为 0 0 0 ,可以将方差和二阶矩等价联系起来。
由柯西不等式得:
∣
γ
k
∣
=
∣
E
(
Y
k
+
1
Y
1
)
∣
≤
E
Y
k
+
1
2
Y
1
2
=
γ
0
.
|\gamma_k|=|{\rm E}(Y_{k+1}Y_1)|\leq\sqrt{{\rm E}Y_{k+1}^2Y_1^2}=\gamma_0.
∣γk∣=∣E(Yk+1Y1)∣≤EYk+12Y12=γ0.
由自协方差函数的概念可以等价得到自相关系数的概念,在此之前需要引入标准化序列的概念。
由于平稳序列经过线性变换后仍然是平稳序列,因此特别取
Y
t
=
X
t
−
μ
γ
0
,
t
∈
Z
Y_t=\frac{X_t-\mu}{\displaystyle\sqrt{\gamma_0}}\ , \ \ \ \ t\in\Z
Yt=γ0Xt−μ , t∈Z
就得到标准化的平稳序列
{
Y
t
}
\{Y_t\}
{Yt} ,这时有
E
Y
t
=
0
{\rm E}Y_t=0
EYt=0 ,
E
Y
t
2
=
1
{\rm E}Y_t^2=1
EYt2=1 对每个
t
t
t 成立。
设平稳序列 { X t } \{X_t\} {Xt} 的标准化序列是 { Y t } \{Y_t\} {Yt} , { Y t } \{Y_t\} {Yt} 的自协方差函数
ρ k = γ k γ 0 , k ∈ Z \rho_k=\frac{\gamma_k}{\gamma_0}\ , \ \ \ \ k\in\Z ρk=γ0γk , k∈Z
称为平稳序列 { X t } \{X_t\} {Xt} 的自相关系数。
自相关系数 { ρ k } \{\rho_k\} {ρk} 满足规范性,即 ρ 0 = 1 \rho_0=1 ρ0=1 且 ∣ ρ k ∣ ≤ 1 |\rho_k|\leq1 ∣ρk∣≤1 ,同样也满足对称性和非负定性。
随机变量的线性相关
定义随机向量 X = ( X 1 , X 2 , . . . , X n ) T \boldsymbol{X}=(X_1,X_2,...,X_n)^{\rm T} X=(X1,X2,...,Xn)T ,则 Γ n = V a r ( X ) \boldsymbol{\Gamma}_n={\rm Var}(\boldsymbol{X}) Γn=Var(X) 。
关于随机向量
X
\boldsymbol{X}
X 和矩阵
A
,
B
\boldsymbol{A},\,\boldsymbol{B}
A,B ,有
E
(
A
+
B
X
)
=
A
+
B
E
(
X
)
,
{\rm E}(\boldsymbol{A}+\boldsymbol{B}\boldsymbol{X})=\boldsymbol{A}+\boldsymbol{B}{\rm E}(\boldsymbol{X}),
E(A+BX)=A+BE(X),
V a r ( A + B X ) = B V a r ( X ) B T , {\rm Var}(\boldsymbol{A}+\boldsymbol{B}\boldsymbol{X})=\boldsymbol{B}{\rm Var}(\boldsymbol{X})\boldsymbol{B}^{\rm T}, Var(A+BX)=BVar(X)BT,
且 X \boldsymbol{X} X 的协方差阵 V a r ( X ) {\rm Var}(\boldsymbol{X}) Var(X) 总是非负定的。
我们已知自协方差矩阵 Γ n \boldsymbol{\Gamma}_n Γn 是非负定的,接下来讨论的 Γ n \boldsymbol{\Gamma}_n Γn 退化条件,即 Γ n \boldsymbol{\Gamma}_n Γn 的不满秩条件。
设向量
a
n
=
(
a
1
,
a
2
,
.
.
.
,
a
n
)
T
\boldsymbol{a}_n=(a_1,a_2,...,a_n)^{\rm T}
an=(a1,a2,...,an)T ,则
a
n
T
Γ
n
a
n
=
V
a
r
(
a
n
T
X
)
=
V
a
r
(
∑
i
=
1
n
a
i
X
i
)
≥
0
\boldsymbol{a}_n^{\rm T}\boldsymbol{\Gamma}_n\boldsymbol{a}_n={\rm Var}(\boldsymbol{a}_n^{\rm T}\boldsymbol{X})={\rm Var}\left(\sum_{i=1}^na_iX_i\right)\geq0
anTΓnan=Var(anTX)=Var(i=1∑naiXi)≥0
因此
Γ
n
\boldsymbol{\Gamma}_n
Γn 退化当且仅当存在一个非零向量
a
n
≠
0
\boldsymbol{a}_n\neq0
an=0 使得
V
a
r
(
a
n
T
X
)
=
V
a
r
(
∑
i
=
1
n
a
i
X
i
)
=
0
{\rm Var}(\boldsymbol{a}_n^{\rm T}\boldsymbol{X})={\rm Var}\left(\sum_{i=1}^na_iX_i\right)=0
Var(anTX)=Var(i=1∑naiXi)=0
这时称随机变量
X
1
,
X
2
,
.
.
.
,
X
n
X_1,X_2,...,X_n
X1,X2,...,Xn 是线性相关的,即
X
1
,
X
2
,
.
.
.
,
X
n
X_1,X_2,...,X_n
X1,X2,...,Xn 的非零线性组合
a
n
T
X
\boldsymbol{a}_n^{\rm T}\boldsymbol{X}
anTX 是退化随机变量(常数)。
进一步有如果 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn 线性相关,则只要 m ≥ n m\geq n m≥n ,有 X 1 , X 2 , . . . , X m X_1,X_2,...,X_m X1,X2,...,Xm 线性相关。
白噪声序列
白噪声是用来描述简单随机干扰的平稳序列,是最简单的平稳序列。
设 { ϵ t } \{\epsilon_t\} {ϵt} 是一个平稳序列,如果对任何 s , t ∈ N s,\,t\in\N s,t∈N ,
E ( ϵ t ) = μ , C o v ( ϵ t , ϵ s ) = { σ 2 , t = s , 0 , t ≠ s , {\rm E}(\epsilon_t)=\mu \ , \ \ \ \ {\rm Cov}(\epsilon_t,\,\epsilon_s)=\left\{ \begin{array}{ll} \sigma^2\ , & t=s\ ,\\ 0\ , & t\neq s\ , \end{array} \right. E(ϵt)=μ , Cov(ϵt,ϵs)={σ2 ,0 ,t=s ,t=s ,
就称 { ϵ t } \{\epsilon_t\} {ϵt} 是一个白噪声,记作 W N ( μ , σ 2 ) {\rm WN}(\mu,\,\sigma^2) WN(μ,σ2) 。
- 当 { ϵ t } \{\epsilon_t\} {ϵt} 是独立序列时,称 { ϵ t } \{\epsilon_t\} {ϵt} 是独立白噪声;
- 当 μ = 0 \mu=0 μ=0 时,称 { ϵ t } \{\epsilon_t\} {ϵt} 是零均值白噪声;
- 当 μ = 0 \mu=0 μ=0 且 σ 2 = 1 \sigma^2=1 σ2=1 时,称 { ϵ t } \{\epsilon_t\} {ϵt} 是标准白噪声;
- 当 ϵ t ∼ N ( 0 , 1 ) \epsilon_t\sim{\rm N}(0,\,1) ϵt∼N(0,1) 时,称 { ϵ t } \{\epsilon_t\} {ϵt} 是正态白噪声,易证正态白噪声也是一类独立白噪声。
正交平稳序列
首先引入随机变量的正交性和不相关性的概念。
设 X X X 和 Y Y Y 是方差有限的随机变量,如果 E ( X Y ) = 0 {\rm E}(XY)=0 E(XY)=0 ,就称 X X X 和 Y Y Y 是正交的。如果 C o v ( X , Y ) = 0 {\rm Cov}(X,\,Y)=0 Cov(X,Y)=0 ,就称 X X X 和 Y Y Y 是不相关的。
对于零均值的随机变量,正交性和不相关性等价。
下面给出平稳序列的正交性和不相关性的概念。
对于平稳序列 { X t } \{X_t\} {Xt} 和 { Y t } \{Y_t\} {Yt} ,
如果对任何 s , t ∈ Z s,\,t\in\Z s,t∈Z , E ( X t Y s ) = 0 {\rm E}(X_tY_s)=0 E(XtYs)=0 ,则称 { X t } \{X_t\} {Xt} 和 { Y t } \{Y_t\} {Yt} 是正交的;
如果对任何 s , t ∈ Z s,\,t\in\Z s,t∈Z , C o v ( X t , Y s ) = 0 {\rm Cov}(X_t,\,Y_s)=0 Cov(Xt,Ys)=0 ,则称 { X t } \{X_t\} {Xt} 和 { Y t } \{Y_t\} {Yt} 是不相关的;
对于零均值的平稳序列,正交性和不相关性等价。
具有正交性或不相关性的平稳序列具有如下良好的性质:
设平稳序列 { X t } \{X_t\} {Xt} 和 { Y t } \{Y_t\} {Yt} 的自协方差函数分别为 γ X ( k ) \gamma_X(k) γX(k) 和 γ Y ( k ) \gamma_Y(k) γY(k) ,数学期望分别为 μ X \mu_X μX 和 μ Y \mu_Y μY 。定义
Z t = X t + Y t , t ∈ Z . Z_t=X_t+Y_t \ , \ \ \ \ t\in\Z . Zt=Xt+Yt , t∈Z.
(1) 如果 { X t } \{X_t\} {Xt} 和 { Y t } \{Y_t\} {Yt} 正交,则 { Z t } \{Z_t\} {Zt} 是平稳序列,且有自协方差函数
γ Z ( k ) = γ X ( k ) + γ Y ( k ) − 2 μ X μ Y , k = 0 , 1 , 2 , . . . \gamma_Z(k)=\gamma_X(k)+\gamma_Y(k)-2\mu_X\mu_Y\ , \ \ \ \ k=0,1,2,... γZ(k)=γX(k)+γY(k)−2μXμY , k=0,1,2,...
(2) 如果 { X t } \{X_t\} {Xt} 和 { Y t } \{Y_t\} {Yt} 不相关,则 { Z t } \{Z_t\} {Zt} 是平稳序列,且有自协方差函数
γ Z ( k ) = γ X ( k ) + γ Y ( k ) , k = 0 , 1 , 2 , . . . \gamma_Z(k)=\gamma_X(k)+\gamma_Y(k)\ , \ \ \ \ k=0,1,2,... γZ(k)=γX(k)+γY(k) , k=0,1,2,...
证明 { Z t } \{Z_t\} {Zt} 是平稳序列需要证明以下三条性质
二阶矩有限:
E
Z
t
2
=
E
(
X
t
+
Y
t
)
2
≤
E
(
X
t
2
+
Y
t
2
)
<
∞
.
{\rm E}Z_t^2={\rm E}(X_t+Y_t)^2\leq{\rm E}(X_t^2+Y_t^2)<\infty.
EZt2=E(Xt+Yt)2≤E(Xt2+Yt2)<∞.
均值为常数:
μ
Z
=
E
Z
t
=
E
(
X
t
+
Y
t
)
=
μ
X
+
μ
Y
.
\mu_Z={\rm E}Z_t={\rm E}(X_t+Y_t)=\mu_X+\mu_Y.
μZ=EZt=E(Xt+Yt)=μX+μY.
自协方差函数只与时间差有关:
如果
{
X
t
}
\{X_t\}
{Xt} 和
{
Y
t
}
\{Y_t\}
{Yt} 正交:
C
o
v
(
Z
t
,
Z
s
)
=
C
o
v
(
X
t
,
X
s
)
+
C
o
v
(
X
t
,
Y
s
)
+
C
o
v
(
Y
t
,
X
s
)
+
C
o
v
(
Y
t
,
Y
s
)
=
γ
X
(
t
−
s
)
+
γ
Y
(
t
−
s
)
+
E
(
X
t
Y
s
)
−
E
(
X
t
)
E
(
Y
s
)
+
E
(
Y
t
X
s
)
−
E
(
Y
t
)
E
(
X
s
)
=
γ
X
(
t
−
s
)
+
γ
Y
(
t
−
s
)
+
0
−
μ
X
μ
Y
+
0
−
μ
X
μ
Y
=
γ
X
(
t
−
s
)
+
γ
Y
(
t
−
s
)
−
2
μ
X
μ
Y
.
\begin{aligned} {\rm Cov}(Z_t,\,Z_s)&={\rm Cov}(X_t,\,X_s)+{\rm Cov}(X_t,\,Y_s)+{\rm Cov}(Y_t,\,X_s)+{\rm Cov}(Y_t,\,Y_s) \\ &=\gamma_X(t-s)+\gamma_Y(t-s)+{\rm E}(X_tY_s)-{\rm E}(X_t){\rm E}(Y_s)+{\rm E}(Y_tX_s)-{\rm E}(Y_t){\rm E}(X_s) \\ &=\gamma_X(t-s)+\gamma_Y(t-s)+0-\mu_X\mu_Y+0-\mu_X\mu_Y \\ &=\gamma_X(t-s)+\gamma_Y(t-s)-2\mu_X\mu_Y. \end{aligned}
Cov(Zt,Zs)=Cov(Xt,Xs)+Cov(Xt,Ys)+Cov(Yt,Xs)+Cov(Yt,Ys)=γX(t−s)+γY(t−s)+E(XtYs)−E(Xt)E(Ys)+E(YtXs)−E(Yt)E(Xs)=γX(t−s)+γY(t−s)+0−μXμY+0−μXμY=γX(t−s)+γY(t−s)−2μXμY.
如果
{
X
t
}
\{X_t\}
{Xt} 和
{
Y
t
}
\{Y_t\}
{Yt} 不相关:
C
o
v
(
Z
t
,
Z
s
)
=
C
o
v
(
X
t
,
X
s
)
+
C
o
v
(
X
t
,
Y
s
)
+
C
o
v
(
Y
t
,
X
s
)
+
C
o
v
(
Y
t
,
Y
s
)
=
γ
X
(
t
−
s
)
+
0
+
0
+
γ
Y
(
t
−
s
)
=
γ
X
(
t
−
s
)
+
γ
Y
(
t
−
s
)
.
\begin{aligned} {\rm Cov}(Z_t,\,Z_s)&={\rm Cov}(X_t,\,X_s)+{\rm Cov}(X_t,\,Y_s)+{\rm Cov}(Y_t,\,X_s)+{\rm Cov}(Y_t,\,Y_s) \\ &=\gamma_X(t-s)+0+0+\gamma_Y(t-s) \\ &=\gamma_X(t-s)+\gamma_Y(t-s). \end{aligned}
Cov(Zt,Zs)=Cov(Xt,Xs)+Cov(Xt,Ys)+Cov(Yt,Xs)+Cov(Yt,Ys)=γX(t−s)+0+0+γY(t−s)=γX(t−s)+γY(t−s).
令
t
−
s
=
k
t-s=k
t−s=k 即可得证自协方差函数的表达式。