受控自回归滑动平均模型（ARMAX）的系统辨识

最新推荐文章于 2025-04-22 10:44:29 发布

颹蕭蕭

最新推荐文章于 2025-04-22 10:44:29 发布

阅读量1w

点赞数 7

分类专栏：时间序列 # 矩阵论控制论文章标签： CARMA ARMAX 系统辨识

我们不生产知识，我们只是互联网的搬运工

本文链接：https://blog.csdn.net/itnerd/article/details/105849773

版权

时间序列同时被 3 个专栏收录

90 篇文章

订阅专栏

控制论

44 篇文章

订阅专栏

矩阵论

39 篇文章

订阅专栏

文章目录

系统模型
似然函数
辨识过程
关于参数的梯度与海森矩阵
- 梯度
- 海森矩阵

受控自回归滑动平均模型 (Controled Auto Regression and Moving Average model, CARMA)，亦称带外部输入的自回归滑动平均模型 (Auto Regression and Moving Average model with eXogenous input, ARMAX)是应用非常广泛的线性系统模型，本文介绍该模型的一种系统辨识方法：最大似然法。

系统模型

$y_k + a_1y_{k-1} + \cdots a_n y_{k-n} = \\ b_1u_{k-1}+ b_n u_{k-n} + e_{k} + c_1 e_{k-1} + \cdots + c_n e_{k-n}$
即
$y_k = -\sum_{i=1}^n a_iy_{k-i} + \sum_{i=1}^n b_i u_{k-i}+ \sum_{i=1}^n c_i e_{k-i} + e_{k}$
该模型在 ARMA 的基础上考虑了外部输入 $u (k)$ 对输出的影响，为方便讨论，在此设定 $a, b, c$ 的下标都是从 $1$ 到 $n$ ，实际上不必如此。

似然函数

在数理统计学中，似然函数是一种关于统计模型中的参数的函数，表示模型参数中的似然性。
给定输出x时，关于参数θ的似然函数L(θ|x)（在数值上）等于给定参数θ后变量X的概率：

$L(\theta | X) = P(X|\theta)$

在统计学中，“似然性”和“概率”有明确的区分。概率用于在已知一些参数的情况下，预测接下来的观测所得到的结果，而似然性则是用于在已知某些观测所得到的结果时，对有关事物的性质的参数进行估计。

假定误差 $e (k)$ 服从 $0$ 均值、方差为 $\sigma^2$ 的高斯分布，则有似然函数为：
$\begin{array}{ll} P(Y_N | U_N,\Theta) &= P(y_N, \ldots | u_N, \ldots, \Theta) \\\\ &= P(y_0)\Pi _{k=1}^NP(y_k| Y_{k-1},U_N,\Theta) \\\\ &= P(y_0)\Pi _{k=1}^NP(e_k) \\\\ &= P(y_0)(2\pi)^{-N/2}\sigma^{-N} \exp \left[ -(1/2\sigma^2)\sum_{k=1}^N e_k^2\right] \tag{1} \end{array}$
其中
$\begin{array}{ll} e_k &= y_k - \phi_i \Theta \\\\ \phi_k & = [-y_{k-1}, \ldots, -y_{k-n} | u_{k-1}, \ldots, u_{k-n} | e_{k-1}, \ldots, e_{k-n}]^\top \\\\ \Theta &= [a_1, \ldots, a_n | b_i, \ldots, b_n | c_1, \dots, c_n ]^\top \end{array}$
最大化似然(1)等价于最小化负对数似然(2)
$J(\sigma, \Theta) = N \ln \sigma + \frac{1}{2\sigma^2}\sum_k^N e_k^2 \tag{2}$

辨识过程

在实际辨识过程中，由于参数 $\Theta$ 未知，误差 $e_k$ 不能精确获得，所以计算过程中用其估计值 $\nu_k \simeq e_k$ 来替代。

代价函数：
$J(\sigma_\nu, \Theta) = N \ln \sigma_{\nu} + \frac{1}{2\sigma_\nu^2}\sum_k^N \nu_k^2 \tag{2}$

采集 $N$ 组数据，估计一个初始 $\Theta_0$ ，比如先假定误差项系数 $c_i=0$ ，用最小二乘法求解 $a_i, b_i$ ；
$k = 0$
固定 $\Theta$ （即固定 $\nu$ ），更新 $\sigma_\nu$ :
$\sigma_\nu = \argmin_{\sigma_\nu} J = \sqrt{\sum_k \nu_k^2/N}$
固定 $\sigma_\nu$ ，更新 $\Theta$ ，即最小化
$\sum_k \nu_k^2$
采用牛顿法更新参数：
$\Theta_{t+1} = \Theta_t - H^{-1} \nabla_{\Theta} L$
$k = k + 1$ ，重复以上交替优化过程直到
$\frac{\sigma_t^2 - \sigma_{t-1}^2}{\sigma_{t-1}^2} < 10^{-4}$

关于参数的梯度与海森矩阵

梯度

$\frac{\partial L}{\partial \Theta} = 2\sum \nu_k \frac{\partial \nu_k}{\partial \Theta} \tag{3}$
这里稍稍有一点复杂，因为：
$\nu_k = y_k + \sum_{i=1}^n a_iy_{k-i} - \sum_{i=1}^n b_i u_{k-i} - \sum_{i=1}^n c_i \nu_{k-i} = y_k - \phi_k ^\top\Theta$
所以
$\frac{\partial \nu_k}{\partial a_i} = y_{k-i} - \sum_{l=1}^n c_l \frac{\partial \nu_{k-l}}{\partial a_i} \\ \frac{\partial \nu_k}{\partial b_i} = -u_{k-i} - \sum_{l=1}^n c_l \frac{\partial \nu_{k-l}}{\partial b_i} \\ \frac{\partial \nu_k}{\partial c_i} = -\nu_{k-i}- \sum_{l=1}^n c_l \frac{\partial \nu_{k-l}}{\partial c_i}$
可以合并成
$\frac{\partial \nu_k}{\partial \Theta} = -\phi_{k}^\top - \sum_{l=1}^n c_l \frac{\partial \nu_{k-l}}{\partial \Theta}$
所以 $\partial L/\partial \Theta$ 已求得！

海森矩阵

假定 $\partial \nu_k/\partial \Theta$ 为行向量
$\frac{\partial ^2L}{\partial \Theta^2} = \frac{\partial }{\partial \Theta}\left(2\sum \nu_k \frac{\partial \nu_k}{\partial \Theta} \right) \\ = 2\left( \sum_k \left(\frac{\partial \nu_k}{\partial \Theta}\right)^\top \left( \frac{\partial \nu_k}{\partial \Theta}\right) + \nu_k \frac{\partial^2 \nu_k}{\partial \Theta^2}\right)$
主要需要考虑 $\partial^2 \nu/ \partial \Theta^2$ :
$\frac{\partial^2 \nu_k}{ \partial a_i \partial a_j} = - \sum_{l=1}^n c_l \frac{\partial^2 \nu_{k-l}}{\partial a_i\partial a_j} \\ \frac{\partial^2 \nu_k}{ \partial a_i \partial b_j} = - \sum_{l=1}^n c_l \frac{\partial^2 \nu_{k-l}}{\partial a_i\partial b_j} \\ \frac{\partial^2 \nu_k}{ \partial a_i \partial c_j} = -\frac{\partial \nu_{k-j}}{\partial a_i} - \sum_{l=1}^n c_l \frac{\partial^2 \nu_{k-l}}{\partial a_i\partial c_j} \\ \frac{\partial^2 \nu_k}{ \partial b_i \partial c_j} = -\frac{\partial \nu_{k-j}}{\partial b_i} - \sum_{l=1}^n c_l \frac{\partial^2 \nu_{k-l}}{\partial a_i\partial c_j} \\ \frac{\partial^2 \nu_k}{ \partial c_i \partial c_j} = -2\frac{\partial \nu_{k-j}}{\partial c_i} - \sum_{l=1}^n c_l \frac{\partial^2 \nu_{k-l}}{\partial c_i\partial c_j} \\$
写成矩阵形式：
$H_k = -\sum_{l=1}^n c_lH_{k-l} - G_k -G_k^\top \\ G_k = \left[ 0 \ldots 0 \bigg| 0 \ldots 0 \bigg| \left(\frac{\partial \nu_{k-1}}{\partial \Theta}\right)^\top \ldots \left(\frac{\partial \nu_{k-n}}{\partial \Theta}\right)^\top \right]_{3n\times 3n}$
再次强调一下： $\partial \nu_{k}/\partial \Theta$ 是行向量，因为 $\Theta$ 是列向量！