Kalman滤波(Part-1：信号模型基础)

最新推荐文章于 2023-07-07 12:16:10 发布

Turbo-shengsong

最新推荐文章于 2023-07-07 12:16:10 发布

阅读量1.8k

点赞数

分类专栏：数学基础信息与通信文章标签：线性代数概率论矩阵算法

本文链接：https://blog.csdn.net/weixin_43413559/article/details/124159915

版权

信息与通信同时被 2 个专栏收录

22 篇文章 21 订阅

订阅专栏

数学基础

20 篇文章 6 订阅

订阅专栏

Kalman Filters

Dynamical Signal Models

一阶高斯-马尔可夫过程(first-order Gauss-Markov process):描述采样点之间（相邻）的相关性：
$\tag{1}$

其中 $u [n]$ 是高斯白噪声(White Gaussian Noise, WGN)，方差为 $\sigma^2_u$ ， $s[-1]\sim \mathcal{N}(\mu_s,\sigma^2_s)$ ， $s [- 1]$ 与 $u [n]$ 相互独立( $\forall n \geq 0$ )。该模型也常被称为dynamical model / state model

将 $s [n]$ 表示为初始条件 $s [- 1]$ 的函数形式：
$\begin{aligned} s[0] &= as[-1] + u[0] \\ s[1] &= as[0] + u[1] \\ &= a^2 s[-1] + au[0] + u[1] \\ & \text{etc.} \end{aligned}$

一般地，我们有
$a^{n+1} s[-1] + \sum_{k=0}^n a^k u[n-k] \tag{2}$

高斯随机过程(Gaussian random process):给定 $k$ ，对任意的采样点 $\{s[n_1],\cdots,s[n_k]\}$ ， $k$ 维随机向量 $\boldsymbol{s} = [s[n_1],\cdots,s[n_k]]^T$ 的分布为高维的高斯PDF，就认为 $s [n]$ 是一个高斯随机过程。

因为随机变量 $s [- 1]$ 和 $u[\cdot]$ 都是高斯随机变量并且相互独立，不难看出， $s [n]$ 是一个高斯随机过程。另外，
$\mathbb{E} [s[n]] = a^{n+1} \mathbb{E}[s[-1]]=a^{n+1} \mu_s$

采样点 $s [m]$ 与 $s [n]$ 之间的协方差为：
$\begin{aligned} c_s[m,n] &= \mathbb{E} \left [ (s[m] - \mathbb{E} [s[m]]) (s[n] - \mathbb{E} [s[n]]) \right] \\ &= \mathbb{E} \left [ \left( a^{m+1}(s[-1] - \mu_s) + \sum_{k=0}^m a^k u[m-k] \right ) \cdot \left( a^{n+1}(s[-1] - \mu_s) + \sum_{l=0}^n a^l u[n-l] \right ) \right] \\ &= a^{m+n+2} \sigma_s^2 + \sum_{k=0}^m \sum_{l=0}^n a^{k+l} \mathbb{E} [u[m-k] u [n-l]] \end{aligned}$

但是
$\mathbb{E} [u[m-k] u [n-l]] = \sigma^2_u \delta [k - (l+m-n)]$

因此，当 $\geq n$ 时
$\begin{aligned} c_s[m,n] &= a^{m+n+2} \sigma_s^2 + \sigma^2_u a^{m-n} \sum_{l=0}^n a^{2l} \end{aligned}$

当 $m < n$ 时， $c_s[m,n] = c_s[n,m]$ 。基于上述协方差，可以得到方差为
$\begin{aligned} \text{var}[s[n]] &= c_s[n,n] \\ &= a^{2n+2} \sigma^2_s + \sigma^2_u \sum_{l=0}^n a^{2l} \end{aligned}$

显然，因为 $\mathbb{E} [s[n]] = a^{n+1} \mu_s$ 与 $n$ 相关，且协方差与 $m, n$ 相关，因此 $s [n]$ 不是一个广义平稳过程(Wide-sense stationary, WSS)。然而，当 $\rightarrow \infty$ 时
$\begin{aligned} \mathbb{E} [s[n]] & \rightarrow 0 \\ c_s[m,n] &\rightarrow \frac{\sigma_u^2 a^{m-n}}{1 - a^2} \end{aligned}$

因为 $∣ a ∣ < 1$ （该条件对于整个过程的稳定是必要的，否则，均值和方差将会随着 $n$ 呈指数形式增长）

因为高斯-马尔可夫过程的特殊形式，其均值和方差也可以被迭代地表征(式(3,4)被称为均值与方差传播公式)
$\mathbb{E} [s[n]] = a \mathbb{E} [s[n-1]] \tag{3}$

$\begin{aligned} \text{var}[s[n]] &= \mathbb{E} \left [ (s[n] - \mathbb{E}[s[n]]^2)^2 \right] \\ &= \mathbb{E} \left [ {\left ( as[n-1] + u[n] - a\mathbb{E}[s[n-1]] \right)}^2 \right] \\ &= a^2 \text{var}[s[n-1]] + \sigma^2_u \tag{{4}} \end{aligned}$

其中我们使用了 $\mathbb{E}[u[n]s[n-1]] = 0$ ，这是因为 $s [n - 1]$ 只取决于 $\{s[-1], u[0], \cdots, u[n-1]\}$ ，且这些随机变量独立于 $u [n]$ 。注意到，在式（4）中，第一项 $a s [n - 1]$ 会造成方差减小，第二项的积累 $\sigma^2_u$ 会造成方差增大，在达到稳态(steady state)后，或者 $n\rightarrow\infty$ ，两项的作用相互平衡，收敛为 $\sigma^2_u / (1-a^2)$ .

考虑一个 $p$ 阶的高斯-马尔可夫过程：
$\sum_{k=1}^p a[k] s[n-k] + u[n] \tag{5}$

因为 $s [n]$ 取决于前 $p$ 个采样点，所以均值和方差传播式变得更加复杂。为了拓展之前的结论，我们指定 $\{s[n-1],s[n-2],\cdots,s[n-p]\}$ 为采样时刻 $n$ 的系统状态(system state)，我们定义状态向量：
$\boldsymbol{s}\left[ n-1 \right] =\left[ \begin{array}{c} \begin{array}{c} s\left[ n-p \right]\\ s\left[ n-p+1 \right]\\ \end{array}\\ \vdots\\ s\left[ n-1 \right]\\ \end{array} \right] \tag{6}$

我们可以把式(10)写为
$\left[ \begin{array}{c} \begin{array}{c} s\left[ n-p+1 \right]\\ s\left[ n-p+2 \right]\\ \end{array}\\ \vdots\\ \begin{array}{c} s\left[ n-1 \right]\\ s\left[ n \right]\\ \end{array}\\ \end{array} \right] =\mathop {\underbrace{\left[ \begin{matrix}{} 0& 1& 0& \cdots& 0\\ 0& 0& 1& \cdots& 0\\ 0& 0& 0& \cdots& 0\\ \vdots& \vdots& \vdots& \ddots& \vdots\\ -a\left[ p \right]& -a\left[ p-1 \right]& -a\left[ p-2 \right]& \cdots& -a\left[ 1 \right]\\ \end{matrix} \right] }} \limits_{\boldsymbol{A}}\left[ \begin{array}{c} \begin{array}{c} s\left[ n-p \right]\\ s\left[ n-p+1 \right]\\ \end{array}\\ \vdots\\ \begin{array}{c} s\left[ n-2 \right]\\ s\left[ n-1 \right]\\ \end{array}\\ \end{array} \right] +\mathop {\underbrace{\left[ \begin{array}{c} 0\\ 0\\ \vdots\\ 1\\ \end{array} \right] }} \limits_{\boldsymbol{B}}u\left[ n \right]$

其中的前 $(p - 1)$ 个方程为方阵，根据定义，将上式写为状态向量的形式：
$\boldsymbol s[n] = \boldsymbol A \boldsymbol s[n-1] + \boldsymbol B \boldsymbol u[n] \tag{7}$

其中 $\boldsymbol{ A}$ 是一个 $\times p$ 的非奇异矩阵（称为状态转移矩阵：state transition matrix）， $\boldsymbol{ B}$ 是一个 $\times 1$ 的向量。式(7)的形式被称为向量高斯-马尔可夫模型(Vector Gauss-Markov Model)。更一般的模型可表示为，
$\boldsymbol s[n] = \boldsymbol A \boldsymbol s[n-1] + \boldsymbol B \boldsymbol u[n] \tag{8}$

其中 $\boldsymbol{A,B}$ 都是固定的矩阵， $\boldsymbol{ A}$ 的维度为 $\times p$ ， $\boldsymbol{B}$ 的维度为 $\times r$ 。 $\boldsymbol{ s}[n]$ 是一个 $\times 1$ 的信号向量， $\boldsymbol{ u}[n]$ 是一个驱动噪声矢量(driving noise vector)。我们称式(8)为状态模型(state model)，该模型的统计假设有：

输入的 $\boldsymbol{u}[n]$ 是高斯白噪声，q向量，即 $\boldsymbol{ u}[n]$ 是一个不相关的联合高斯分布的序列，且 $\mathbb{E}[\boldsymbol{u}[n]] = \boldsymbol{ 0}$ ，
$\mathbb{E}[\boldsymbol u[m] \boldsymbol u^T[n]] = \boldsymbol{ 0}, \ \ \ \ m\neq n$ $\boldsymbol{u}[n]$ 的协方差为：
$\mathbb{E}[\boldsymbol u[n] \boldsymbol u^T[n]] = \boldsymbol{Q}$ 其中 $\boldsymbol{ Q}$ 是一个 $\times r$ 的正定矩阵。
初始状态 $\boldsymbol{ s}[-1]$ 是随机向量: $\boldsymbol{s}[-1] \sim \mathcal{N}(\boldsymbol{\mu}_s, \boldsymbol{C}_s)$ 独立于 $\boldsymbol{u}[n], \forall n \geq 0$

我们进一步推导向量高斯-马尔可夫模型的统计特征（标量模型的扩展），依据式（8），
$\begin{aligned} \boldsymbol s [0] & = \boldsymbol A \boldsymbol s [-1] + \boldsymbol{ B}\boldsymbol u [0] \\ \boldsymbol s [1] & = \boldsymbol A \boldsymbol s [0] + \boldsymbol{ B}\boldsymbol u [1] \\ &= \boldsymbol A^2 \boldsymbol s [-1] + \boldsymbol{A B}\boldsymbol u [0] + \boldsymbol{ B}\boldsymbol u [1] \\ & \text{etc.} \end{aligned}$

一般地，我们可以推广得到
$\boldsymbol s[n] = \boldsymbol A^{n+1} \boldsymbol s[-1] + \sum_{k=0}^n \boldsymbol A^k \boldsymbol B \boldsymbol u[n-k]$

其中 $\boldsymbol{A}^0=\boldsymbol{I}$ ，可以看出， $\boldsymbol{ s}[n]$ 初始条件 $\boldsymbol{s}[-1]$ 和 $\boldsymbol{u}[\cdot]$ 的线性组合，因此， $\boldsymbol{s}[n]$ 是一个高斯随机过程，那么就只需要决定其均值和方差。
$\mathbb{E}[\boldsymbol s[n]] = \boldsymbol A^{n+1} \mathbb{E}[\boldsymbol s[-1]] = \boldsymbol A^{n+1} \boldsymbol \mu_s \tag{9}$

其协方差：
$\begin{aligned} \boldsymbol C_s[m,n] &= \mathbb{E} \left [ {\left( \boldsymbol s[m] - \mathbb{E}[\boldsymbol s[m]] \right)} {\left( \boldsymbol s[n] - \mathbb{E}[\boldsymbol s[n]] \right)}^T \right] \\ & = \mathbb{E} \left [ \left( \boldsymbol A^{m+1} (\boldsymbol s[-1] - \boldsymbol \mu_s) + \sum_{k=0}^m \boldsymbol A^k \boldsymbol B \boldsymbol u[m-k] \right) \cdot {\left( \boldsymbol A^{n+1} (\boldsymbol s[-1] - \boldsymbol \mu_s) + \sum_{l=0}^n \boldsymbol A^l \boldsymbol B \boldsymbol u[n-l] \right)}^T \right] \\ &= \boldsymbol A^{m+1} \boldsymbol C_s \boldsymbol A^{{n+1}^T} + \sum_{k=0}^m \sum_{l=0}^n \boldsymbol A^k \boldsymbol B \mathbb{E} \left [ \boldsymbol{ u}[m-k] \boldsymbol{u}^T[n-l]\right] \boldsymbol B^T \boldsymbol A^{l^T} \end{aligned}$

注意到，
$\mathbb{E} \left [ \boldsymbol{ u}[m-k] \boldsymbol{u}^T[n-l]\right] = \boldsymbol Q \delta [l-(n-m+k)]$

因此，当 $\geq n$ 时，
$\boldsymbol C_s[m,n] = \boldsymbol A^{m+1} \boldsymbol C_s \boldsymbol A^{{n+1}^T} + \sum_{l=0}^n \boldsymbol A^{l+m-n} \boldsymbol {BQB}^T \boldsymbol A^{l^T} \tag{{10}}$

当 $m < n$ 时，
$\boldsymbol C_s[m,n] = \boldsymbol C_s^T[n,m]$

那么协方差矩阵可以表示为：
$\begin{aligned} \boldsymbol C[n] &= \boldsymbol C_s[n,n] \\ &= \boldsymbol A^{n+1} \boldsymbol C_s \boldsymbol A^{{n+1}^T} + \sum_{k=0}^n \boldsymbol A^k \boldsymbol{BQB}^T \boldsymbol A^{k^T} \tag{11} \end{aligned}$

期望和方差的传播方程可以写为：
$\boldsymbol E[\boldsymbol s[n]] = \boldsymbol A \boldsymbol E[\boldsymbol s [n-1]] \tag{12}$

$\boldsymbol C[n] = \boldsymbol A \boldsymbol C[n-1] \boldsymbol A^T + \boldsymbol {BQB}^T$

注意，只有当 $\boldsymbol{A}$ 的特征值幅度都小于1，才是一个稳定的过程(steady process)。

当 $\rightarrow \infty$ 时，
$\mathbb{E} [\boldsymbol s [n]] = \boldsymbol A^{n+1} \boldsymbol \mu_s \rightarrow \boldsymbol 0$

$\boldsymbol A^{n+1} \boldsymbol C_s \boldsymbol A^{{n+1}^T} \rightarrow 0$

因此，
$\boldsymbol C[n] \rightarrow \boldsymbol C = \sum_{k=0}^{\infty} \boldsymbol A^k \boldsymbol {BQB}^T \boldsymbol A^{k^T} \tag{13}$

另外，当 $n\rightarrow\infty$ ， $\boldsymbol{C}[n-1]=\boldsymbol{C}[n]$ ，那么稳态的协方差矩阵为方程(14)的解：
$\boldsymbol C = \boldsymbol {ACA}^T + \boldsymbol {BQB}^T \tag{14}$

该方程被称为Lyapunov equation.

将上述模型和定理总结如下：

定理-1：向量高斯马尔可夫模型(Vector Gauss-Markov Model)：对一个 $\times 1$ 的信号向量 $\boldsymbol{ s}[n]$ ，其高斯-马尔可夫模型为：
$\boldsymbol s[n] = \boldsymbol A \boldsymbol s[n-1] + \boldsymbol B \boldsymbol u [n], \ \ \ \ n \geq 0 \tag{15}$

$\boldsymbol{A} (p \times p)$ 和 $\boldsymbol{ B} (p \times r)$ 已知，假设 $\boldsymbol A$ 的特征值幅度小于1， $\boldsymbol{u}[n] (r \times 1)$ 为高斯白噪声向量， $\boldsymbol{u}[n] \sim \mathcal{N}(\boldsymbol{0},\boldsymbol{Q})$ 且 $\{\boldsymbol{u}[n]\}$ 之间相互独立。初始条件 $\boldsymbol{s}[-1] \sim \mathcal N(\boldsymbol{ \mu}_s,\boldsymbol C_s)$ ，独立于 $\{\boldsymbol{u}[n]\}$ ，那么该信号过程是高斯的，且其均值为
$\mathbb{E} [\boldsymbol s [n]] = \boldsymbol A^{n+1} \boldsymbol \mu_s \tag{16}$

当 $\geq n$ 时，协方差为
$\boldsymbol C_s[m,n] = \boldsymbol A^{m+1} \boldsymbol C_s \boldsymbol A^{{n+1}^T} + \sum_{l=0}^n \boldsymbol A^{l+m-n} \boldsymbol {BQB}^T \boldsymbol A^{l^T} \tag{{17}}$