【时间序列分析】14. 最佳线性预测

最新推荐文章于 2023-04-26 22:28:03 发布

这个XD很懒

最新推荐文章于 2023-04-26 22:28:03 发布

阅读量2.3k

点赞数 3

分类专栏：【时间序列分析】知识总结

本文链接：https://blog.csdn.net/weixin_45449414/article/details/112505153

版权

本文详细介绍了最佳线性预测的概念、预测方程的解及其存在性，以及最佳线性预测的唯一性和相关性质。通过解决线性预测问题，找到使预测误差均方误差最小的线性组合，探讨了预测方程的解法和预测误差的性质，为时间序列预测提供了理论基础。

摘要由CSDN通过智能技术生成

最佳线性预测

最佳线性预测

最佳线性预测的概念

对于时间序列进行统计分析的主要目的之一是解决时间序列的预测问题。这里我们主要讨论平稳序列的预测问题。由于平稳序列的方差有限，所以我们总是假设以下内容中随机变量的方差有限。

首先，我们先来描述一下什么是线性预测问题。设 $X_1,X_2,\cdots,X_n$ 为某时间序列的一段， $Y$ 是一个随机变量，我们考虑用 $X_1,X_2,\cdots,X_n$ 的线性组合对 $Y$ 进行预测。记
$\boldsymbol{X}=(X_1,X_2,\cdots,X_n)^{\rm T} \ , \ \ \ \ \boldsymbol{a}=(a_1,a_2,\cdots,a_n)^{\rm T}\in\R^n\ ,$
则 $Y$ 的线性预测有以下形式：
$\boldsymbol{a}^{\rm T}\boldsymbol{X}=\sum_{j=1}^na_jX_j=\boldsymbol{X}^{\rm T}\boldsymbol{a} \ , \ \ \ \ \boldsymbol{a}\in\R^n.$
我们比较关注的是在上面的所有预测中找到最好的一个，即要找一个 $\boldsymbol{a}$ ，使得 $\boldsymbol{a}^{\rm T}\boldsymbol{X}$ 距离 $Y$ 最近，于是引出最佳线性预测的定义。

设 $Y$ 和 $X_j$ $(1\leq j\leq n)$ 是均值为零，方差有限的随机变量。如果 $\boldsymbol{a}\in\R^n$ ，使得对任何的 $\boldsymbol{b}\in\R^n$ ，有
${\rm E}(Y-\boldsymbol{a}^{\rm T}\boldsymbol{X})\leq{\rm E}(Y-\boldsymbol{b}^{\rm T}\boldsymbol{X})\ ,$
则称 $\boldsymbol{a}^{\rm T}\boldsymbol{X}$ 是用 $X_1,X_2,\cdots,X_n$ 对 $Y$ 进行预测的最佳线性预测 ，记做 $\hat{Y}$ 或 $L(Y|\boldsymbol{X})$ 。于是
$\hat{Y}=L(Y|\boldsymbol{X})=\boldsymbol{a}^{\rm T}\boldsymbol{X} \ .$
当 $\hat{Y}=\boldsymbol{a}^{\rm T}\boldsymbol{X}$ 时， $Y-\hat{Y}=Y-\boldsymbol{a}^{\rm T}\boldsymbol{X}$ 被称为预测误差， ${\rm E}\left(Y-\hat{Y}\right)^2={\rm E}\left(Y-\boldsymbol{a}^{\rm T}\boldsymbol{X}\right)^2$ 被称为预测的均方误差。所以，在均方误差方差最小的意义下，最佳线性预测确实是所有线性预测中最好的。

注意如果 $\boldsymbol{X}$ 和 $Y$ 均不是零均值的，但有 $L(Y|\boldsymbol{X})$ 是用 $X_1,X_2,\cdots,X_n$ 对 $Y$ 的最佳线性预测，则一定有
${\rm E}L(Y|X)={\rm E}Y \ ,$

这与零均值时的情况是一致的，因此以后的讨论我们都假设随机变量的均值为零。

用 $\boldsymbol\Gamma={\rm E}\left(\boldsymbol{X}\boldsymbol{X}^{\rm T}\right)$ 表示 $\boldsymbol{X}$ 的协方差阵，用 $\boldsymbol\Sigma_{\boldsymbol{X}Y}={\rm E}(\boldsymbol{X}Y)$ 表示 $\boldsymbol{X}$ 和 $Y$ 的协方差向量。

预测方程及其求解

预测方程的解

在定义了最佳线性预测之后，我们想知道在已知 $\boldsymbol{X}$ 和 $Y$ 的情况下如何找到最佳线性预测，换句话说我们想知道如何找到这个“最好”的 $\boldsymbol{a}$ 。接下来我们引出预测方程的概念和性质，这也是我们要讨论的最佳线性预测的性质 1 。

性质 1 ：如果 $\boldsymbol{a}\in\R$ ，使得
$\boldsymbol\Gamma\boldsymbol{a}={\rm E}(\boldsymbol{X}Y)=\boldsymbol\Sigma_{\boldsymbol{X}Y} \ ,$
则有
$L(Y|\boldsymbol{X})=\boldsymbol{a}^{\rm T}\boldsymbol{X} \ ,$

${\rm E}(Y-L(Y|\boldsymbol{X}))^2={\rm E}Y^2-{\rm E}[L(Y|\boldsymbol{X})]^2={\rm E}Y^2-\boldsymbol{a}^{\rm T}\boldsymbol\Gamma\boldsymbol{a} \ .$

如果 $\boldsymbol\Gamma$ 和 $\boldsymbol\Sigma_{\boldsymbol{X}Y}$ 已知，则以 $\boldsymbol{a}$ 为未知数的方程 $\boldsymbol\Gamma\boldsymbol{a}=\boldsymbol\Sigma_{\boldsymbol{X}Y}$ 称为预测方程 。

下面证明满足预测方程的 $\boldsymbol{a}$ 确实是我们要找的“最好”的 $\boldsymbol{a}$ ，即此时的 $\boldsymbol{a}^{\rm T}\boldsymbol{X}$ 是最佳线性预测。

证明：对任何 $\boldsymbol{b}\in\R^n$ ，
$\begin{aligned} {\rm E}\left(Y-\boldsymbol{b}^{\rm T}\boldsymbol{X}\right)^2 &={\rm E}\left[Y-\boldsymbol{a}^{\rm T}\boldsymbol{X}+\left(\boldsymbol{a}^{\rm T}-\boldsymbol{b}^{\rm T}\right)\boldsymbol{X}\right]^2 \\ &={\rm E}\left(Y-\boldsymbol{a}^{\rm T}\boldsymbol{X}\right)^2+{\rm E}\left[\left(\boldsymbol{a}^{\rm T}-\boldsymbol{b}^{\rm T}\right)\boldsymbol{X}\right]^2+2{\rm E}\left[\left(\boldsymbol{a}^{\rm T}-\boldsymbol{b}^{\rm T}\right)\boldsymbol{X}\left(Y-\boldsymbol{a}^{\rm T}\boldsymbol{X}\right)\right] \\ &={\rm E}\left(Y-\boldsymbol{a}^{\rm T}\boldsymbol{X}\right)^2+{\rm E}\left[\left(\boldsymbol{a}^{\rm T}-\boldsymbol{b}^{\rm T}\right)\boldsymbol{X}\right]^2+2\left(\boldsymbol{a}^{\rm T}-\boldsymbol{b}^{\rm T}\right)\left[{\rm E}(\boldsymbol{X}Y)-{\rm E}\left(\boldsymbol{X}\boldsymbol{X}^{\rm T}\right)\boldsymbol{a}\right] \\ \end{aligned}$