Yule-Walker方程完整推导过程以及python代码复现

最新推荐文章于 2023-07-26 14:41:30 发布

yuanzhoulvpi

最新推荐文章于 2023-07-26 14:41:30 发布

阅读量1w

点赞数 7

分类专栏：时间序列 python 文章标签： python 机器学习线性代数时间序列

本文链接：https://blog.csdn.net/yuanzhoulvpi/article/details/120591284

版权

python 同时被 2 个专栏收录

74 篇文章

订阅专栏

时间序列

7 篇文章

订阅专栏

本文详细介绍了如何使用Yule-Walker方法来计算自回归（AR）模型的参数，通过数学推导和代码示例展示了从p=1到p=2的情况，并解释了该方法如何解决AR模型的系数估计问题。此外，还提供了python代码实现Yule-Walker公式来计算自相关函数（ACF）和偏自相关函数（PACF）。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Every cell phone call solves the Yule-Walker equations every ten microseconds. ——Thierry Dutoit

介绍

代码、数据全部免费，都放在我的gitee仓库里面https://gitee.com/yuanzhoulvpi/time_series，想要使用的可以直接到我这个仓库下载。

本文是继python与时间序列(开篇)的第3篇。在找pacf如何计算的时候，发现现在计算pacf都在用Yule-Walker方法，包括在计算AR§的时候也是这个方程。（不是不用别的方法了）。

我在这里把Yule-Walker方法的公式推导写出来，并且把我写的python代码也整理出来。方便参考。

使用Yule-Walker方法计算AR§

计算一个均值为0的离散随机时间序列 ${X_i\} ^ N$ 的AR§参数，怎么做？
我们要估计的也就是下面公式中的 $\xi_{i+1}$

$x_{i+1}=\phi_{1} x_{i}+\phi_{2} x_{i-1}+\cdots+\phi_{p} x_{i-p+1}+\xi_{i+1} \tag 1$

1.转置

1.1 p=1

p=1的时候，公式变成这样 $X_{i+1} = \phi_1 x_i + \epsilon_{i+1}$
上面的形式可以进一步写成这样：
$\underbrace{\left(\begin{array}{c} x_{2} \\ x_{3} \\ \vdots \\ x_{N} \end{array}\right)}_{\mathbf{b}}=\underbrace{\left(\begin{array}{c} x_{1} \\ x_{2} \\ \vdots \\ x_{N-1} \end{array}\right)}_{\mathbf{A}} \phi_{1}$

可以使用最小二乘法求解：
$\hat{\phi}_{1}=\left(\mathbf{A}^{T} \mathbf{A}\right)^{-1} \mathbf{A}^{T} \mathbf{b}=\frac{\sum_{i=1}^{N-1} x_{i} x_{i+1}}{\sum_{i=1}^{N-1} x_{i}^{2}}=\frac{c_{1}}{c_{o}}=r_{1}$
上面的 $c_{i}$ 、 $r_{i}$ 分别是第i个自协方差和自协方差系数。

1.2 p=2

p=2的时候，公式变成这样 $X_{i+1} = \phi_1 x_i +\phi_2 x_{i-1} + \epsilon_{i+1}$
上面的形式进一步写成这样：

$\underbrace{\left(\begin{array}{c} x_{3} \\ x_{4} \\ \vdots \\ x_{N} \end{array}\right)}_{\mathbf{b}}=\underbrace{\left(\begin{array}{cc} x_{2} & x_{1} \\ x_{3} & x_{2} \\ \vdots & \vdots \\ x_{N-1} & x_{N-2} \end{array}\right)}_{\mathbf{A}} \underbrace{\left(\begin{array}{c} \phi_{1} \\ \phi_{2} \end{array}\right)}_{\Phi} .$

和第一个不一样，这个时候上面的等式写成这样：
$\hat{\boldsymbol{\Phi}}=\left(\mathbf{A}^{T} \mathbf{A}\right)^{-1} \mathbf{A}^{T} \mathbf{b}$
是这么计算的：
$\begin{gathered} \left(\mathbf{A}^{T} \mathbf{A}\right)^{-1}=\left[\left(\begin{array}{llll} x_{2} & x_{3} & \cdots & x_{N-1} \\ x_{1} & x_{2} & \cdots & x_{N-2} \end{array}\right)\left(\begin{array}{cc} x_{2} & x_{1} \\ x_{3} & x_{2} \\ x_{N-1} & x_{N-2} \end{array}\right)\right]^{-1} \\ =\left(\begin{array}{cc} \sum_{i=2}^{N-1} x_{i}^{2} & \sum_{i=2}^{N-1} x_{i} x_{i-1} \\ \sum_{i=2}^{N-1} x_{i} x_{i-1} & \sum_{i=1}^{N-2} x_{i}^{2} \end{array}\right)^{-1} \\ =\frac{1}{\sum_{i=2}^{N-1} x_{i}^{2} \sum_{i=1}^{N-2} x_{i}^{2}-\sum_{i=2}^{N-1} x_{i} x_{i-1} \sum_{i=2}^{N-1} x_{i} x_{i-1}}\left(\begin{array}{cc} \sum_{i=1}^{N-2} x_{i}^{2} & -\sum_{i=2}^{N-1} x_{i} x_{i-1} \\ -\sum_{i=2}^{N-1} x_{i} x_{i-1} & \sum_{i=2}^{N-1} x_{i}^{2} \end{array}\right) \end{gathered}$

接下来，假设时间序列是平稳的，所以说自协方差只和滞后多少项相关。利用这个性质，在这个案例里面可以得到这样的等式：

$\begin{gathered} \left(\mathbf{A}^{T} \mathbf{A}\right)^{-1}=\frac{1}{c_{o}^{2}-c_{1}^{2}}\left(\begin{array}{rr} c_{o} & -c_{1} \\ -c_{1} & c_{o} \end{array}\right) \\ \left(\mathbf{A}^{T} \mathbf{A}\right)^{-1}=\frac{1}{c_{o}^{2}\left(1-r_{1}^{2}\right)}\left(\begin{array}{rr} c_{o} & -c_{1} \\ -c_{1} & c_{o} \end{array}\right) \\ \left(\mathbf{A}^{T} \mathbf{A}\right)^{-1}=\frac{1}{c_{o}\left(1-r_{1}^{2}\right)}\left(\begin{array}{rr} r_{o} & -r_{1} \\ -r_{1} & r_{o} \end{array}\right) \end{gathered}$
而且：
$\mathbf{A}^{T} \mathbf{b}=\left(\begin{array}{llll} x_{2} & x_{3} & \cdots & x_{N-1} \\ x_{1} & x_{2} & \cdots & x_{N-2} \end{array}\right)\left(\begin{array}{l} x_{3} \\ x_{4} \\ \vdots \\ x_{N} \end{array}\right)=\left(\begin{array}{l} \sum_{i=3}^{N} x_{i} x_{i-1} \\ \sum_{i=3}^{N} x_{i} x_{i-2}, \end{array}\right)$

又因为这个时间序列是平稳的，所以：

$\mathbf{A}^{T} \mathbf{b}=\left(\begin{array}{l} c_{1} \\ c_{2} \end{array}\right)$

结合上面的公式，可以有：
$\begin{gathered} \left(\mathbf{A}^{T} \mathbf{A}\right)^{-1} \mathbf{A}^{T} \mathbf{b}=\frac{1}{c_{o}\left(1-r_{1}^{2}\right)}\left(\begin{array}{rr} r_{o} & -r_{1} \\ -r_{1} & r_{o} \end{array}\right)\left(\begin{array}{l} c_{1} \\ c_{2} \end{array}\right) \\ =\frac{1}{1-r_{1}^{2}}\left(\begin{array}{rr} 1 & -r_{1} \\ -r_{1} & 1 \end{array}\right)\left(\begin{array}{l} r_{1} \\ r_{2} \end{array}\right) . \end{gathered}$
将上面的矩阵分为两个部分，可以得到：
$\hat{\phi}_{1}=\frac{r_{1}\left(1-r_{2}\right)}{1-r_{1}^{2}}$

以及
$\hat{\phi}_{2}=\frac{r_{2}-r_{1}^{2}}{1-r_{1}^{2}}$

虽然可以按照p=2继续计算p=3的情况，但是那样的话，代数计算会变得很复杂。
幸运的是，有一种简单的方法来计算AR§的系数，这个方法就叫Yule-Waler公式。

2. Yule-Waler公式

这是一个AR§公式：
$x_{i+1}=\phi_{1} x_{i}+\phi_{2} x_{i-1}+\cdots+\phi_{p} x_{i-p+1}+\xi_{i+1}$

2.1 lag=1（滞后1）

在左右两边乘上 $x_{i}$ ，得
$x_{i} x_{i+1}=\sum_{j=1}^{p}\left(\phi_{j} x_{i} x_{i-j+1}\right)+x_{i} \xi_{i+1}$

i和j是各自的时间索引。把 $\{\phi_j\}$ 都拎出来， $x_j$ 都写到一起，得到这样的公式：
$\left\langle x_{i} x_{i+1}\right\rangle=\sum_{j=1}^{p}\left(\phi_{j}\left\langle x_{i} x_{i-j+1}\right\rangle\right)+\left\langle x_{i} \xi_{i+1}\right\rangle$

注意到 $\left\langle x_{i} \xi_{i+1}\right\rangle = 0$ 因为截距 $\xi$ 和当前时间是无关的，因此：
$\left\langle x_{i} x_{i+1}\right\rangle=\sum_{j=1}^{p}\left(\phi_{j}\left\langle x_{i} x_{i-j+1}\right\rangle\right)$

再除以N-1，再利用自协方差的平衡性: $c_{-l} = c_{l}$ ，得：
$c_{1}=\sum_{j=1}^{p} \phi_{j} c_{j-1}$

再除以 $c_0$ ，得：
$r_{1}=\sum_{j=1}^{p} \phi_{j} r_{j-1}$

2.2 lag=2（滞后2）

两边乘以 $x_{i-1}$ , 得到：

$x_{i-1} x_{i+1}=\sum_{j=1}^{p}\left(\phi_{j} x_{i-1} x_{i-j+1}\right)+x_{i-1} \xi_{i+1}$

然后：
$\left\langle x_{i-1} x_{i+1}\right\rangle=\sum_{j=1}^{p}\left(\phi_{j}\left\langle x_{i-1} x_{i-j+1}\right\rangle\right)+\left\langle x_{i-1} \xi_{i+1}\right\rangle$

然后：
$\left\langle x_{i-1} x_{i+1}\right\rangle=\sum_{j=1}^{p}\left(\phi_{j}\left\langle x_{i-1} x_{i-j+1}\right\rangle\right)$

然后：
$c_{2}=\sum_{j=1}^{p} \phi_{j} c_{j-2}$

然后：
$r_{2}=\sum_{j=1}^{p} \phi_{j} r_{j-2}$

2.3 lag=k(滞后k)

两边乘以 $x_{i-k-1}$ , 得到：

$x_{i-k+1} x_{i+1}=\sum_{j=1}^{p}\left(\phi_{j} x_{i-k+1} x_{i-j+1}\right)+x_{i-k+1} \xi_{i+1}$

然后：
$\left\langle x_{i-k+1} x_{i+1}\right\rangle=\sum_{j=1}^{p}\left(\phi_{j}\left\langle x_{i-k+1} x_{i-j+1}\right\rangle\right)+\left\langle x_{i-k+1} \xi_{i+1}\right\rangle$

然后：
$\left\langle x_{i-k+1} x_{i+1}\right\rangle=\sum_{j=1}^{p}\left(\phi_{j}\left\langle x_{i-k+1} x_{i-j+1}\right\rangle\right)$

然后：
$c_{k}=\sum_{j=1}^{p} \phi_{j} c_{j-k}$

然后：
$r_{k}=\sum_{j=1}^{p} \phi_{j} r_{j-k}$

2.4 lag=p(滞后p)

两边乘以 $x_{i-p-1}$ , 得到：

$x_{i-p+1} x_{i+1}=\sum_{j=1}^{p}\left(\phi_{j} x_{i-p+1} x_{i-j+1}\right)+x_{i-p+1} \xi_{i+1}$

然后：
$\left\langle x_{i-p+1} x_{i+1}\right\rangle=\sum_{j=1}^{p}\left(\phi_{j}\left\langle x_{i-p+1} x_{i-j+1}\right\rangle\right)+\left\langle x_{i-p+1} \xi_{i+1}\right\rangle$

然后：
$\left\langle x_{i-p+1} x_{i+1}\right\rangle=\sum_{j=1}^{p}\left(\phi_{j}\left\langle x_{i-p+1} x_{i-j+1}\right\rangle\right)$

然后：
$c_{p}=\sum_{j=1}^{p} \phi_{j} c_{j-p}$

然后：
$r_{p}=\sum_{j=1}^{p} \phi_{j} r_{j-p}$

2.5 将上面的公式放一起

有：
$\begin{gathered} r_{1}=\phi_{1} r_{o}+\phi_{2} r_{1}+\phi_{3} r_{2}+\cdots+\phi_{p-1} r_{p-2}+\phi_{p} r_{p-1} \\ r_{2}=\phi_{1} r_{1}+\phi_{2} r_{o}+\phi_{3} r_{1}+\cdots+\phi_{p-1} r_{p-3}+\phi_{p} r_{p-2} \\ \vdots \\ r_{p-1}=\phi_{1} r_{p-2}+\phi_{2} r_{p-3}+\phi_{3} r_{p-4}+\cdots+\phi_{p-1} r_{o}+\phi_{p} r_{1} \\ r_{p}=\phi_{1} r_{p-1}+\phi_{2} r_{p-2}+\phi_{3} r_{p-3}+\cdots+\phi_{p-1} r_{1}+\phi_{p} r_{o} \end{gathered}$
可以被写成：
$\left(\begin{array}{c} r_{1} \\ r_{2} \\ \vdots \\ r_{p-1} \\ r_{p} \end{array}\right)=\left(\begin{array}{cccccc} r_{o} & r_{1} & r_{2} & \cdots & r_{p-2} & r_{p-1} \\ r_{1} & r_{o} & r_{1} & \cdots & r_{p-3} & r_{p-2} \\ & \vdots & & & \vdots & \\ r_{p-2} & r_{p-3} & r_{p-4} & \cdots & r_{o} & r_{1} \\ r_{p-1} & r_{p-2} & r_{p-3} & \cdots & r_{1} & r_{o} \end{array}\right)\left(\begin{array}{c} \phi_{1} \\ \phi_{2} \\ \vdots \\ \phi_{p-1} \\ \phi_{p} \end{array}\right)$

又因为 $r_0 = 1$ ，所以可以写成：
$\underbrace{\left(\begin{array}{c} r_{1} \\ r_{2} \\ \vdots \\ r_{p-1} \\ r_{p} \end{array}\right)}_{\mathbf{r}} \underbrace{\left(\begin{array}{cccccc} 1 & r_{1} & r_{2} & \cdots & r_{p-2} & r_{p-1} \\ r_{1} & 1 & r_{1} & \cdots & r_{p-3} & r_{p-2} \\ & \vdots & & & \vdots & \\ r_{p-2} & r_{p-3} & r_{p-4} & \cdots & 1 & r_{1} \\ r_{p-1} & r_{p-2} & r_{p-3} & \cdots & r_{1} & 1 \end{array}\right)}_{\mathbf{R}} \underbrace{\left(\begin{array}{c} \phi_{1} \\ \phi_{2} \\ \vdots \\ \phi_{p-1} \\ \phi_{p} \end{array}\right)}_{\boldsymbol{\Phi}}$
整理成：
$\mathbf{R} \boldsymbol{\Phi}=\mathbf{r} \tag 2$

最终可以写成这样
$\hat{\boldsymbol{\Phi}}=\mathbf{R}^{-1} \mathbf{r}$

3. Yule-Walker公式求解过程

循环i， $\leq i \leq p$
- 计算 $\mathbf{R} ^ {(i)}$ 和 $\mathbf{r} ^ {(i)}$
- 然后计算 $\hat{\boldsymbol{\Phi}}^{(i)}$ ，公式为：
  $\hat{\boldsymbol{\Phi}}^{(i)}=\left(\mathbf{R}^{(i)}\right)^{-1} \mathbf{r}^{(i)}=\left(\begin{array}{c} \hat{\phi}_{1} \\ \hat{\phi}_{2} \\ \vdots \\ \hat{\phi}_{i} \end{array}\right)$
- 只保留 $\hat{\phi}_{i}$ ，在 $\leq j \leq {i-1}$ 范围内的 $\hat{\phi}_{j}$ 都不要
- 第i个pacf系数这个时候就等于 $\hat{\phi}_{i}$
结束循环i

4. python计算Yule-Walker公式

代码如下：

from scipy.linalg import toeplitz
import numpy as np


def cal_my_yule_walker(x, nlags=5):
    """
    自己实现yule_walker理论
    :param x:
    :param nlags:
    :return:
    """
    x = np.array(x, dtype=np.float64)
    x -= x.mean()
    n = x.shape[0]

    r = np.zeros(shape=nlags+1, dtype=np.float64)
    r[0] = (x ** 2).sum()/n

    for k in range(1, nlags+1):
        r[k] = (x[0:-k] * x[k:]).sum() / (n-k*1)


    R = toeplitz(c=r[:-1])
    result = np.linalg.solve(R, r[1:])
    return result

def cal_my_pacf_yw(x, nlags=5):
    """
    自己通过yule_walker方法求出pacf的值
    :param x:
    :param nlags:
    :return:
    """
    pacf = np.empty(nlags+1) * 0
    pacf[0] = 1.0
    for k in range(1, nlags+1):
        pacf[k] = cal_my_yule_walker(x,nlags=k)[-1]

    return pacf


# 测试函数
data_x = np.random.randint(low=10, high=20, size=20)

# 使用yelu_walker方法计算pacf
cal_my_pacf_yw(data_x)

参考资料：

http://www.stat.wharton.upenn.edu/~steele/Courses/956/ResourceDetails/YuleWalkerAndMore.htm
https://www.statsmodels.org/stable/generated/statsmodels.tsa.stattools.pacf.html
https://gitee.com/yuanzhoulvpi/time_series