AR(Autoregressive)模型

最新推荐文章于 2024-07-23 01:54:21 发布

行者yy

最新推荐文章于 2024-07-23 01:54:21 发布

阅读量1k

点赞数 1

分类专栏：机器学习文章标签： ar 机器学习概率论

本文链接：https://blog.csdn.net/qq_40848423/article/details/125122225

版权

机器学习专栏收录该内容

10 篇文章 2 订阅

订阅专栏

背景介绍

自回归模型：用同一变量的历史值预测未来值。
应用背景：弱平稳时间序列 ${x_t\}$ (即满足： $E(x_t)=\mu,Cov(x_t,x_{t-l})=\gamma_l$ 性质的时间序列)

模型

$\left\{\tag{1} \begin{aligned} & x_t = \varphi_0 + \sum_{i=1}^p \varphi_i x_{t-i} + \varepsilon_t \\ & \varphi_p \neq 0 \\ & E(\varepsilon_t)=0,var(\varepsilon_t)=\sigma^2,E(\varepsilon_t \varepsilon_s)=0,s\neq t \\ & E(x_s \varepsilon_t)=0,\forall s < t \end{aligned} \right.$

限制条件

$\varphi_p \neq 0$ ，确保模型的最高阶数为 $p$ ；
$E(\varepsilon_i) = 0,Var(\varepsilon_i) = \sigma_{\varepsilon}^2,E(\varepsilon_t \varepsilon_s)=0,s\neq t$ ，要求随机干扰序列 $\{\varepsilon_t\}$ 为零均值白噪声序列；
$E(x_s \varepsilon_t)=0,\forall s < t$ ，当期的随机干扰与过去的序列值无关。

通常默认限制条件，把 $A R (p)$ 模型简记为：
$x_t = \varphi_0 + \sum_{i=1}^p \varphi_i x_{t-i} + \varepsilon_t \tag{2}$

统计性质

均值

由 ${x_t\}$ 的弱平稳性知， $E(x_t)=\mu$
$E(x_t) = \varphi_0 + \sum_{i=1}^p \varphi_i E(x_{t-i}) + E(\varepsilon_t) \tag{3}$

$\mu = \frac{\varphi_0}{1-\sum_{i=1}^p \varphi_i} \tag{4}$

对于中心化 $A R (p)$ 模型，有 $E(x_t)=0$ ，显然对于任意 $A R (p)$ 模型都可以通过减去自身均值 $\mu$ 从而变为中心化 $A R (p)$ 模型。

自协方差函数

含义：度量变量过去的行为对现在的影响。

定义1：对于时间序列 $\{x_t,t \in T\}$ ，任取 $t,s\in T$ ， $\gamma_{t,s}$ 为序列 ${x_t\}$ 的自协方差函数
$\gamma_{t,s}=E(x_t-\mu_t)(x_s-\mu_s) \tag{5}$
对于中心化 $A R (p)$ 模型而言， $\mu_t=\mu_s=0$ ，因此
$\gamma_{t,s}=E(x_t x_s) \tag{6}$
定义2： $\gamma_k$ 为时间序列 ${x_t\}$ 的延迟 $k$ 阶自协方差函数 $\gamma_k=\gamma_{t,t-k}=E(x_t,x_{t-k})$ 。

在中心化 $A R (p)$ 模型 $x_t=\sum_{i=1}^p \varphi_i x_{t-i} + \varepsilon_t$ 等式两边同乘 $x_{t-k}(k \ge 1)$ ，再求期望得
$E(x_t x_{t-k}) = \sum_{i=1}^p \varphi_i E(x_{t-i}x_{t-k})+E(\varepsilon_t x_{t-k}),\forall k \ge 1 \tag{7}$
由 $A R (p)$ 模型的条件三知 $E(\varepsilon_t x_{t-k})=0$ ，所以
$\gamma_k = \sum_{i=1}^p \varphi_i \gamma_{k-i} \tag{8}$

自相关系数

$\rho_{k} = \frac{\gamma_{t,t-k}}{\sqrt{var(x_t)var(x_{t+k})}}=\frac{\gamma_k}{\gamma_0} \tag{9}$

偏自相关系数

定义

对于平稳序列 ${x_t\}$ ，滞后 $k$ 偏自相关系数就是在给定时间序列中间 $k - 1$ 个随机变量 $x_{t-1},x_{t-2},\cdots,x_{t-k+1}$ 的条件下， $x_{t-k}$ 对 $x_t$ 相关影响的度量。
$\rho_{x_t,x_{t-k}|x_{t-1,\cdots,x_{t-k+1}}} = \frac{E[(x_t - \hat{E}x_t)(x_{t-k} - \hat{E}x_{t-k})]}{E[(x_{t-k}-\hat{E}x_{t-k})^2]} \tag{10}$
式中， $\hat{E}x_t=E[x_t|x_{t-1,\cdots,x_{t-k+1}}]$ ， $\hat{E}x_{t-k}=E[x_{t-k}|x_{t-1,\cdots,x_{t-k+1}}]$

计算方式

考虑 ${x_t\}$ 为中心化平稳序列，用过去的 $k$ 期序列值 $x_{t-1},x_{t-2},\cdots,x_{t-k}$ 对 $x_i$ 作 $k$ 阶自回归拟合，即
$x_t = \varphi_{k1}x_{t-1} + \varphi_{k2}x_{t-2}+\cdots+\varphi_{kk}x_{t-k} + \varepsilon_k \tag{11}$
取期望有：
$\hat{E}x_t = \sum_{i=1}^{k-1} \varphi_{ki}x_{t-i} +\varphi_{kk} \hat{E}(x_{t-k}) \tag{12}$

$x_t - \hat{E}x_t = \varphi_{kk}(x_{t-k} - \hat{E}x_{t-k}) + \varepsilon_t \tag{13}$
等式两边同乘 $x_{t-k} - \hat{E}x_{t-k}$ ，并求期望有：
$E[(x_t - \hat{E}x_t) (x_{t-k} - \hat{E}x_{t-k})] = \varphi_{kk}E[(x_{t-k} - \hat{E}x_{t-k})^2] \tag{14}$

$\varphi_{kk} = \frac{E[(x_t - \hat{E}x_t) (x_{t-k} - \hat{E}x_{t-k})]}{E[(x_{t-k} - \hat{E}x_{t-k})^2]} \tag{15}$
滞后 $k$ 偏自相关系数实际上就等于 $k$ 阶自回归模型第 $k$ 个回归系数 $\varphi_{kk}$ 的值。可以证明平稳 $A R (p)$ 模型的偏自相关系数具有 $p$ 步截尾性，即 $\varphi_{kk}=0(\forall k > p)$ 。

定阶

$A R$ 模型可使用偏自相关函数 $P A C F$ 截尾(相关系数快速收敛到等于0的置信区间内)定阶。

PACF

预测

不妨设预测原点为 $h$ ， $F_h$ 表示在预测原点已知信息， $\hat{x}_h(l)$ 为序列 ${x_t\}$ 的以 $x_h$ 为预测原点的向前 $l$ 步预测（即：在预测原点 $h$ 已知信息 $F_h$ 的条件下， $x_{h+l}$ 的条件均值）。

1步预测

$\begin{aligned} \tag{16} x_{h+1} &=\varphi_0+\sum_{i=1}^p \varphi_i x_{h+1-i}+\varepsilon_{h+1}\\ \hat{x}_h(1) &= E(x_{h+1}|F_h)=\varphi_0+\sum_{i=1}^p \varphi_i x_{h+1-i} \end{aligned}$
注意： $E(\varepsilon_{h+1})=0$ ，是因为随机误差是白噪声序列， $E(x_{h+1-i})=x_{h+1-i}$ 是因为预测原点 $h$ 的前 $p$ 个历史值已然发生，是确定的数值。

1步预测误差：
$\varepsilon_h(1)=x_{h+1}-x_h(1)=\varepsilon_{h+1} \tag{17}$
1步预测误差方差：
$var(\varepsilon_h(1)) = var(\varepsilon_{h+1})=\sigma_{\varepsilon}^2 \tag{18}$

2步预测

$\begin{aligned}\tag{19} x_{h+2} &=\varphi_0+\sum_{i=1}^p \varphi_i x_{h+2-i}+\varepsilon_{h+2}\\ \hat{x}_h(2) &= E(x_{h+2}|F_h)=\varphi_0+\varphi_1 \hat{x}_{h+1} + \sum_{i=2}^p \varphi_i x_{h+2-i} \end{aligned}$
注意：因为在预测原点 $h$ 对 $h + 2$ 时刻的序列值做出预测时， $h + 1$ 时刻的序列值并未发生，所以需要首先计算 $\hat{x}_{h+1}$ 作为 $h + 1$ 时刻序列值的近似替换。

2步预测误差
$\tag{20} \begin{aligned} \varepsilon_h(2) &= x_{h+2}-\hat{x}_h(2)= \varphi_1(x_{h+1}-\hat{x}_h(1)) + \varepsilon_{h+2}\\ &= \varepsilon_{h+2} + \varphi_1 \varepsilon_{h+1} \end{aligned}$
2步预测误差方差
$var(\varepsilon_h(2)) =(1+\varphi_1)\sigma_{\varepsilon}^2 \tag{21}$
显然 $var(\varepsilon_h(2)) > var(\varepsilon_h(1))$ ，这意味着预测步长的增加会使预测的不确定性也增加。

向前多步预测（ $l\ge2$ ）

$\tag{22} \begin{aligned} x_{h+l} &=\varphi_0+\sum_{i=1}^p \varphi_i x_{h+l-i}+\varepsilon_{h+l}\\ \hat{x}_h(l) &= E(x_{h+l}|F_h)=\varphi_0+ \sum_{i=1}^{l-1} \varphi_i \hat{x}_h(i) + \sum_{i=l}^p \varphi_i x_{h+l- i} \end{aligned}$