Time Series Analysis
author:zoxiii
时间序列预处理
【参考文献】王燕. 应用时间序列分析-第5版[M]. 中国人民大学出版社, 2019.
1、平稳时间序列的统计特征
1.1-均值
E ( x t ) = μ t , ∀ t ∈ T E(x_t)=\mu_t~~,~~\forall t \in T E(xt)=μt , ∀t∈T
1.2-方差
D X t = γ ( t , t ) = γ ( 0 ) , ∀ t ∈ T DX_t=\gamma(t,t)=\gamma(0),\forall t \in T DXt=γ(t,t)=γ(0),∀t∈T
1.3-延迟k自协方差函数
γ
(
k
)
=
γ
(
t
,
t
+
k
)
\gamma(k)=\gamma(t,t+k)
γ(k)=γ(t,t+k)
估计值:
γ
^
(
0
)
=
∑
t
=
1
n
(
x
t
−
x
‾
)
2
n
−
1
\hat \gamma(0)=\frac{\sum_{t=1}^{n}{(x_t-\overline x)^2}}{n-1}
γ^(0)=n−1∑t=1n(xt−x)2
1.4-延迟k自相关函数
ρ
k
=
γ
(
t
,
t
+
k
)
D
X
t
⋅
D
X
t
+
k
=
γ
(
k
)
σ
x
2
=
γ
(
k
)
γ
(
0
)
\rho_k=\frac{\gamma(t,t+k)}{\sqrt{DX_t·DX_{t+k}}}=\frac{\gamma(k)}{\sigma_x^2}=\frac{\gamma(k)}{\gamma(0)}
ρk=DXt⋅DXt+kγ(t,t+k)=σx2γ(k)=γ(0)γ(k)
当
k
≪
n
k\ll n
k≪n时:
ρ ^ k ≈ ∑ t = 1 n − k ( x t − x ‾ ) ( x t + k − x ‾ ) ∑ t = 1 n ( x t − x ‾ ) 2 , ∀ 0 ≤ k ≤ n \hat \rho_k \approx \frac{\sum_{t=1}^{n-k}{(x_t-\overline x)(x_{t+k}-\overline x)}}{\sum_{t=1}^n(x_t-\overline x)^2}~~,~~\forall 0 \le k \le n ρ^k≈∑t=1n(xt−x)2∑t=1n−k(xt−x)(xt+k−x) , ∀0≤k≤n
2、平稳性检验
2.1-图检验
(1)时序图
在一个常数附近随机波动,而且波动的范围有界,无明显趋势及周期特征
(2)自相关图
2倍标准差公式
- 如果样本自相关系数和样本偏自相关系数在最初的阶明显大于2倍标准差,而后几乎95%的系数都落在2倍标准差的范围内,且非零系数衰减为小值波动的过程非常突然,通常视为k阶截尾;
- 如果有超过5%的样本相关系数大于2倍标准差,或者非零系数衰减为小值波动的过程比较缓慢或连续,通常视为拖尾。
(3)偏自相关图
- 与自相关图类似
2.2-统计检验
(1)单位根检验
- DF检验
- ADF检验
- PP检验
(2)平稳域检验
- 见AR模型详解
3、纯随机性检验(白噪声检验)
LB统计量
L B = n ( n + 2 ) ∑ i = 1 k ( ρ ^ i 2 n − i ) LB = n(n+2)\sum_{i=1}^{k}{(\cfrac{\hat \rho_i^2}{n-i})} LB=n(n+2)i=1∑k(n−iρ^i2)
其中
n为序列观察期数;k为指定延迟期数
- P值显著大于显著性水平 α \alpha α,不能拒绝纯随机的假设。