【时间序列分析】18.时间序列的递推预测

最新推荐文章于 2024-04-19 17:48:33 发布

江景页

最新推荐文章于 2024-04-19 17:48:33 发布

阅读量752

点赞数

分类专栏：《时间序列分析》学习笔记

本文链接：https://blog.csdn.net/jingye333/article/details/111768440

版权

《时间序列分析》学习笔记专栏收录该内容

19 篇文章

订阅专栏

文章目录

十八、时间序列的递推预测

十八、时间序列的递推预测

1.零均值序列的递推预测

所谓递推预测，其实就是预测这样的问题： $L(Y_{n+1}|\boldsymbol Y_n)$ ，这里 $\boldsymbol Y_n=\overline{\rm sp}(Y_n,\cdots,Y_1)$ ，也就是用有限多项历史信息预测未来的信息。现在讨论零均值时间序列 ${Y_n\}$ 的递推预测，这里并不要求 $Y_n$ 是平稳序列。

由于是递推预测，所以预测是一项一项进行的。对 $Y_1$ 的预测由于没有任何历史信息，所以 $\hat Y_1=0$ ，而获得了 $Y_1$ 的实际观测值后，就可以计算预测误差 $W_1=Y_1-\hat Y_2$ ；接下来对 $Y_2$ 的预测就是 $\hat Y_2=L(Y_2|\boldsymbol Y_1)$ ，得到 $Y_2$ 的观测值后，又可以计算预测误差 $W_2=Y_2-\hat Y_2$ ……由此，在进行我们需要的递推预测 $\hat Y_{n+1}=L(Y_{n+1}|\boldsymbol Y_n)$ 之前，我们已经可以获得以下的信息列：

预测序列 $\{\hat Y_n\}$ ： $\hat Y_1=0$ ，对 $k\ge 1$ 有 $\hat Y_{k+1}=L(Y_{k+1}|\boldsymbol Y_k)$ 。
预测误差序列 ${W_n\}$ ： $W_k=Y_k-\hat Y_k$ ，代表每一次预测的误差观测值。
预测误差方差 $\{\nu_n\}$ ： $\nu_{k}={\rm E}(W_{k+1}^2)$ ，代表每一次预测的均方误差（期望值）。注意这里计算 $\nu_k$ 时我们还没有获得 $Y_{k+1}$ 的观测值。

注意到 $W_k\perp \boldsymbol Y_{k-1}$ 且 $W_k\in \boldsymbol Y_k$ ，所以 ${W_k\}$ 是一个正交序列，有 ${\rm E}(W_nW_k)=\nu_{n-1}\delta_{n-k}$ 。

由于 $\boldsymbol Y_n$ 不是相互正交的，我们希望能够找到一个与 $\boldsymbol Y_n$ 等价的，但是互相正交的序列进行预测。事实上，预测误差序列就是这样的一个序列。记 $\boldsymbol W_n=\overline{\rm sp}(W_1,\cdots,W_n)$ ，我们现在要证明它与 $\boldsymbol Y_n$ 的等价性，也就是 $\forall n,Y_n\in\boldsymbol W_n$ 。

使用数学归纳法，首先 $Y_1=W_1\in M_1$ 是显然的，如果对 $k\le n$ 都有 $Y_k\in \boldsymbol W_k$ ，则对 $k = n + 1$ ，有
$Y_{n+1}=\hat Y_{n+1}+W_{n+1},$
而 $\hat Y_{n+1}\in \boldsymbol Y_n$ ，也就是 $\hat Y_{n+1}\in \boldsymbol W_n$ ，且 $W_{n+1}\in \boldsymbol W_{n+1}$ ，所以 $Y_{n+1}\in \boldsymbol W_{n+1}$ 就证得了，也就意味着我们证明了
$\boldsymbol Y_n=\boldsymbol W_n,\forall n,$
因此我们用 $W_1,\cdots,W_n$ 预测 $Y_{n+1}$ 是合理的，即 $\hat Y_{n+1}=L(Y_{n+1}|\boldsymbol Y_n)=L(Y_{n+1}|\boldsymbol W_n)$ 。

基于用预测误差预测未来的事实，引出如下的递推预测定理。

零均值序列的递推预测：设 ${Y_t\}$ 是零均值时间序列，如果 $(Y_1,\cdots,Y_{m+1})'$ 的协方差矩阵是正定的，则最佳线性预测可以如下表示：
$\hat Y_{n+1}=L(Y_{n+1}|\boldsymbol Y_n)=\sum_{j=0}^{n-1}\theta_{n,n-j}W_{j+1}.$
现在给出预测系数、预测均方误差的递推式，定义 $\sum_{j=0}^{-1}(\cdot)=0$ ，则
$\left\{\begin{array}l \nu_0={\rm E}Y_1^2, \\ \theta_{n,n-k}=\dfrac{{\rm E}(Y_{n+1}Y_{k+1})-\sum\limits_{j=0}^{k-1}\theta_{k,k-j}\theta_{n,n-j}\nu_j}{\nu_k},&0\le k\le n-1,\\ \nu_n={\rm E}(Y_{n+1}^2)-\sum\limits_{j=0}^{n-1}\theta_{n,n-j}^2\nu_j. \end{array} \right.$
如果 ${Y_t\}$ 是平稳的，则 ${\rm E}(Y_{n+1}Y_{k+1})=\gamma_{n-k},{\rm E}(Y_t^2)=\gamma_0$ 。

下设 $0\le k\le n-1$ 。要证明预测定理，只要对 $\hat Y_{n+1}=\sum_{j=1}^n\theta_{n,j}W_{n+1-j}$ 的两边同时乘上 $W_{k+1}$ 并求数学期望，就得到
${\rm E}(\hat Y_{n+1}W_{k+1})=\theta_{n,n-k}\nu_k,$
而因为 $W_{n+1}=Y_{n+1}-\hat Y_{n+1}$ 与 $W_{k+1}$ 正交， ${\rm E}(\hat Y_{n+1}W_{k+1})={\rm E}(Y_{n+1}W_{k+1})$ ，所以
$\theta_{n,n-k}=\frac{{\rm E}(Y_{n+1}W_{k+1})}{\nu_k}=\frac{{\rm E}(Y_{n+1}(Y_{k+1}-\sum_{j=0}^{k-1}\theta_{k,k-j}W_{j+1}))}{\nu_k},$
展开括号就得到结论，而 $\nu_j$ 很容易由勾股定理计算。总结一下，递推预测的系数应该如此计算：
$\begin{matrix} \nu_0, &&&& \hat Y_1=0,&W_1=Y_1; \\ \theta_{1,1} & \nu_1, &&& \hat Y_2=\theta_{1,1}W_1,& W_2=Y_2-\hat Y_2; \\ \theta_{2,2} & \theta_{2,1} & \nu_2, && \hat Y_3=\theta_{2,2}W_1+\theta_{2,1}W_2, & W_3=Y_3-\hat Y_3;\\ \theta_{3,3} & \theta_{3,2} & \theta_{3,3} & \nu_3,&\hat Y_4=\theta_{3,3}W_1+\theta_{3,2}W_2+\theta_{3,1}W_3,&W_4=Y_4-\hat Y_4; \\ \cdots & \cdots & \cdots & \cdots & \cdots & \cdots \end{matrix}$

2.平稳序列与 ${\rm AR}(p)$ 模型的递推预测

对于平稳序列，以上结论更加实用，因为可以将公式里的许多部分替换成自协方差函数。

零均值平稳列的递推预测：设 ${X_t\}$ 是零均值平稳序列， $\Gamma_n=(\gamma_{|i-j|})_{n\times n}$ 是其 $n$ 阶自协方差矩阵，预测误差是 $Z_t=X_t-L(X_t|\boldsymbol X_{t-1})$ ，则
$\hat X_{n+1}=\sum_{j=0}^{n-1}\theta_{n,n-j}Z_{j+1}.$
满足如下的递推公式：定义 $\sum_{j=0}^{-1}(\cdot)=0$ ，则
$\left\{\begin{array}l \nu_0=\gamma_0, \\ \theta_{n,n-k}=\dfrac{\gamma_{n-k}-\sum\limits_{j=0}^{k-1}\theta_{k,k-j}\theta_{n,n-j}\nu_j}{\nu_k},&0\le k\le n-1,\\ \nu_n=\gamma_0-\sum\limits_{j=0}^{n-1}\theta_{n,n-j}^2\nu_j. \end{array} \right.$
递推顺序与非平稳零均值序列一样。

此时，称预测误差 $Z_n$ 为样本新息。

典型的平稳序列有 ${\rm AR}(p),{\rm MA}(q)$ 与 ${\rm ARMA}(p,q)$ 序列，我们将分别讨论其递推预测，先从 ${\rm AR}(p)$ 序列开始。设 ${X_t\}$ 满足 ${\rm AR}(p)$ 模型：
$A(\mathscr B)X_t=\varepsilon_t,\quad X_t=\sum_{j=1}^pa_jX_{t-j}+\varepsilon_t.$
满足特征多项式 $A(z)=1-\sum_{j=1}^pa_jz^j\ne 0,|z|\le 1$ 。事实上，由于 $\varepsilon_t$ 与历史信息无关，所以直觉上，应该会有 $X_t$ 只需要用其前 $p$ 项预测即可，也就是
$L(X_{n+1}|\boldsymbol X_n)=L(X_{n+1}|X_n,X_{n-1},\cdots,X_{n-p+1}).$
事实上也确实如此，因为
$L(X_{n+1}|\boldsymbol X_n)=L\left(\sum_{j=1}^pa_jX_{n-j}+\varepsilon_t\bigg|\boldsymbol X_n \right)=\sum_{j=1}^pa_jX_{n-j}.$
由数学归纳法可以得到 $L(X_{n+k}|\boldsymbol X_n)=L(X_{n+k}|X_n,X_{n-1},\cdots,X_{n-p+1})$ ，也就是说 ${\rm AR}(p)$ 模型的预测总只需要前 $p$ 项即可。那么，前 $p$ 项应该如何预测呢？这就可以用到平稳序列的递推公式了，我们假设白噪声方差为 $\sigma^2$ 。
$\hat X_1=0,\quad \nu_0=\gamma_0,\quad Z_1=X_1.$
接下来计算 $\theta_{1,1}$ ，有
$\theta_{1,1}=\frac{\gamma_1}{\nu_0}=\frac{\gamma_1}{\gamma_0},\quad \hat X_2=\frac{\gamma_1}{\gamma_0}X_1,\quad Z_2=X_2-\frac{\gamma_1}{\gamma_0}X_1,$
再计算 $\theta_{2,2}$ 和 $\theta_{2,1}$ ，有
$\theta_{2,2}=\frac{\gamma_2}{\gamma_0},\theta_{2,1}=\frac{\gamma_1-\theta_{1,1}\theta_{2,2}\nu_0}{\nu_1},\quad \hat X_3=\theta_{2,2}X_1+\theta_{2,1}(X_{2}-\frac{\gamma_1}{\gamma_0}X_1).$
以此类推计算。

3. ${\rm MA}(q)$ 与 ${\rm ARMA}(p,q)$ 序列的递推预测

${\rm MA}(q)$ 序列是有限滑动和，序列满足 $X_t=B(\mathscr B)\varepsilon_t$ ，且自协方差函数 $q$ 后截尾，因此
$L(X_{n+1}|\boldsymbol X_n)=L(X_{n+1}|X_n,X_{n-1},\cdots,X_{n-q+1}),\quad n\ge q.$
现在讨论 $n\ge q$ 时的预测，并假设 $\hat \varepsilon_n=X_n-\hat X_n$ 为逐步预测误差序列。有
$L(X_{n+1}|\boldsymbol X_n)=L(X_{n+1}|X_n,X_{n-1},\cdots,X_{n-q+1})=L(X_{n+1}|\hat\varepsilon_n,\cdots,\hat\varepsilon_{n-q+1}).$
这是因为 $\boldsymbol X_n$ 的张成空间与 $\{\hat\varepsilon_n\}$ 张成空间在任何 $n$ 都相同，所以每次增加的 $X_{n+1}$ 与 $\hat\varepsilon_{n+1}$ 都位于同一纬度。接下来，按照递推公式计算系数 $\theta_{n,1},\cdots,\theta_{n,q}$ 即可。

${\rm ARMA}(p,q)$ 序列则复杂一写，它不像 ${\rm AR}(p)$ 序列一样可由前有限项决定，也不像 ${\rm MA}(q)$ 序列一样 $q$ 后截尾，假设模型是 $A(\mathscr B)X_t=B(\mathscr B)\varepsilon_t$ ，考虑一个这样的变换
$m\xlongequal{def}\max(p,q), \quad Y_t=\left\{\begin{array}l X_t/\sigma,&t=1,2,\cdots,m;\\ A(\mathscr B)X_t/\sigma,&t>m. \end{array}\right.$
这样定义的 $Y_t$ 与白噪声方差 $\sigma^2$ 无关，且当 $t > m$ 时，有
$\sigma Y_t=B(\mathscr B)\varepsilon_t,\Rightarrow Y_t=B(\mathscr B)\tilde \varepsilon_t,\quad t>m.$
也就是当 $Y_t>m$ 的部分是一个 ${\rm MA}(q)$ 模型，从而是 $q$ 后截尾的。设 $W_t$ 是 $Y_t$ 的预测误差，这样定义 $Y_t$ 的好处有以下几点。

首先， $Y_t,X_t$ 的张成空间一样，即 $\boldsymbol Y_t=\boldsymbol X_t$ ，从 $Y_t$ 的定义，当 $t\le m$ 时可以直接看出，当 $t > m$ 时也显然有 $Y_t\in\boldsymbol X_t$ ，并且可以用数学归纳法证明 $X_t\in\boldsymbol Y_t$ ，从而 $\boldsymbol X_t=\boldsymbol Y_t$ 。如果设 $\boldsymbol W_t$ 是 $W_1,\cdots,W_t$ 的张成空间，则又有 $\boldsymbol Y_t=\boldsymbol W_t$ ，从而有
$\boldsymbol X_t=\boldsymbol Y_t=\boldsymbol W_t.$
其次，由于 $Y_t$ 与 $X_t$ 的联系，也可以用 $X_t$ 的自协方差函数 $\gamma_k$ 表示 $Y_t$ 的协方差（但要注意 $Y_t$ 在跨越 $m$ 时不平稳从而不是平稳过程）。当 $s\le t\le m$ 时 $Y_t$ 与 $X_t$ 一样都是 ${\rm ARMA}(p,q)$ 模型，当 $t\ge s>m$ 时 $Y_t$ 是 ${\rm MA}(q)$ 模型，它们的自协方差函数都容易表达，所以只要考虑 $s\le m<t$ 的情况即可。有
${\rm E}(Y_sY_t)=\left\{\begin{array}l \sigma^{-2}\gamma_{t-s},&1\le s\le t\le m;\\ \sigma^{-2}[\gamma_{t-s}-\sum_{j=1}^pa_j\gamma_{t-s-j}],& 1\le s\le m <t;\\ \sum_{j=0}^qb_jb_{j+t-s},&t\ge s>m. \end{array}\right.\\ b_0=1,\quad b_j=0(j>q).$
最后， $Y_t$ 的预测误差 $W_t$ 和 $X_t$ 的预测误差 $Z_t$ 之间也存在联系。当 $1\le t\le m$ 时，
$W_t=Y_t-\hat Y_t=\frac{X_t}{\sigma}-\frac1{\sigma}L(X_t|\boldsymbol X_{t-1})=\frac1{\sigma}Z_t,\\$
当 $t > m$ 时，
$W_t=\frac{1}{\sigma}[A(\mathscr B)X_t-L(A(\mathscr B)X_t|\boldsymbol X_t) ]=\frac1{\sigma}[X_t-L(X_t|\boldsymbol X_{t-1})]=\frac1\sigma Z_t.$
也就是说，不论 $t$ 取什么值， $W_t$ 与 $Z_t$ 之间总只相差一个常数倍，所以它们的均方误差之间也只差 $\sigma^2$ 倍。

接下来就从形式相对简单的 $Y_t$ 入手，推广到 $X_t$ 的预测。对于 $1\le n\le m$ ，有
$\hat Y_{n+1}=\sum_{j=0}^{n-1}\theta_{n,n-j}W_{j+1},\\ \hat X_{n+1}=\sigma \hat Y_{n+1}=\sigma\sum_{j=0}^{n-1}\theta_{n,n-j}W_{j+1}=\sum_{j=0}^{n-1}\theta_{n,n-j}Z_{j+1}.$
对于 $n > m$ ，此时 $Y_{n+1}=\sigma^{-1}B(\mathscr B)\varepsilon_{n+1}$ ，是一个 ${\rm MA}(q)$ 序列，所以结合前面对白噪声序列的讨论，
$L(Y_{n+1}|\boldsymbol Y_n)=\sum_{j=1}^q\theta_{n,j}W_{n+1-j}.$
又因为 $\sigma Y_t=A(\mathscr B)X_t$ ，所以
$X_{n+1}=\sigma Y_{n+1}+\sum_{j=1}^pa_jX_{n+1-j},\\ \hat X_{n+1}=\sum_{j=1}^q\theta_{n,j}Z_{n+1-j}+\sum_{j=1}^pa_jX_{n+1-j}.$
可以看出，在 $n > m$ 时，对 $X_{n+1}$ 的最佳线性预测，既有 ${\rm AR}(p)$ 序列的有限项因素，也有 ${\rm MA}(q)$ 序列预测的 $q$ 后截尾性。

回顾总结

对于零均值序列的递推预测，因为 $\boldsymbol Y_n=\boldsymbol W_n$ ，一般会选择用预测误差序列进行线性预测，这是因为预测误差序列具有正交性。
具体到平稳序列 ${X_t\}$ 情形，如果预测误差为 $Z_t$ ，自协方差函数为 $\gamma_k$ ，则递推公式为
$\hat X_{n+1}=\sum_{j=0}^{n-1}\theta_{n,n-j}W_{j+1}.\\ \nu_0=\gamma_0,\\ \theta_{n,n-k}=\frac{\gamma_{n-k}-\sum_{j=0}^{n-1}\theta_{k,k-j}\theta_{n,n-j}\nu_j}{\nu_{k}}\\ \nu_n=\gamma_0-\sum_{j=0}^{n-1}\theta_{n,n-j}^2\nu_j.$
${\rm AR}(p)$ 序列的预测，只需要用前 $p$ 个历史信息即可； ${\rm MA}(q)$ 序列的预测，只需要用前 $q$ 个预测误差即可。
${\rm ARMA}(p,q)$ 序列的预测，可以构造一个辅助序列，使其具有更简单的形式。具体地，有
$\hat X_{n+1}= \left\{\begin{array}l \sum\limits_{j=0}^{n-1}\theta_{n,n-j}Z_{j+1},& n\le m; \\ \sum\limits_{j=1}^q\theta_{n,1}Z_{n-q+j}+\sum\limits_{j=1}^pa_jX_{n+1-j},&n>m. \end{array}\right.$