最小二乘估计（3）

最新推荐文章于 2024-08-23 17:48:13 发布

EasonZzzzzzz

最新推荐文章于 2024-08-23 17:48:13 发布

阅读量699

点赞数 8

分类专栏：数学之美文章标签：机器学习算法人工智能

本文链接：https://blog.csdn.net/m0_72748751/article/details/141288823

版权

数学之美专栏收录该内容

16 篇文章 2 订阅

订阅专栏

1、最小二乘的性能——估计方差

定量描述估计的误差，估计方差是一个很关键的评价指标。本节给出几种最小二乘方法滤波增益和估计方差的求解方法，这些也是卡尔曼滤波器的理论基础。

估计方差的定义为
$\pmb P(k) = E\left[(\pmb\theta-\hat{\pmb\theta}(k))(\pmb\theta-\hat{\pmb\theta}(k))^T\right]$

式中， $\pmb\theta$ 为待估计参数的真值， $\hat{\pmb\theta}(k)$ 为第 $k$ 步的估计值， $E(\cdot)$ 表示求均值。一般可以认为，所得的估计方差越小，估计方法就越好。

接下来以递推最小二乘方法为例，研究一下最小二乘方法的估计方差。前面已经讲过,权值 $W (k)$ 一般取为测量噪声方差 $R (k)$ 的倒数，如果权值 $W (k)$ 为一个矩阵的话则取为 $R (k)$ 的逆。从现在开始都用 $R^{-1}(k)$ 来代替 $W (k)$ 。
$\boxed{\begin{aligned} \hat{\pmb\theta}(k)&=\hat{\pmb\theta}(k-1)+\pmb M_k\pmb H^T(k)\pmb W(k)\left[Z(k)-\pmb H(k)\hat{\pmb\theta}(k-1) \right]\\ \pmb M_{k}^{-1}&=\pmb M_{k-1}^{-1} + \pmb H^T(k)\pmb W(k)\pmb H(k) \end{aligned}\tag{1}}$

我们令 $\pmb K(k)=\pmb M_k\pmb H^T(k)\pmb R^{-1}(k)$ ，称其为滤波增益，将上式代入估计方差的定义，可以得到
$\begin{aligned} \pmb P(k)&= E\left[(\pmb\theta-\hat{\pmb\theta}(k))(\pmb\theta-\hat{\pmb\theta}(k))^T\right]\\[1ex] &= E\Bigg[\bigg(\pmb\theta-\hat{\pmb\theta}(k-1)-\pmb K(k)\left(Z(k)-\pmb H(k)\hat{\pmb\theta}(k-1) \right)\bigg)\\[1ex] &\quad\ \ \ \ \ \ \ \bigg(\pmb\theta-\hat{\pmb\theta}(k-1)-\pmb K(k)\left(Z(k)-\pmb H(k)\hat{\pmb\theta}(k-1) \right)\bigg)^T\Bigg] \end{aligned}\tag{2}$

再将测量方程 $Z(k)=\pmb H(k)\pmb\theta+N(k)$ 代入上式，考虑到待估计值与 $N (k)$ 不相关，整理后可以得到
$\pmb P(k)=\Big[\pmb I-\pmb K(k)\pmb H(k)\Big]\pmb P(k-1)\Big[\pmb I-\pmb K(k)\pmb H(k)\Big]^T + \pmb K(k)\pmb R(k)\pmb K^T(k)\tag{3}$

接下来讨论递推最小二乘方法的估计性能问题，其结果是最优的吗？

令式（3） $\pmb P(k)$ 求偏导得到的子式等于 0，即
$\frac{\partial\pmb P(k)}{\partial\pmb K(k)} = 2\Big[\pmb I-\pmb K(k)\pmb H(k)\Big]\pmb P(k-1)\Big[-\pmb H^T(k)\Big] + 2\pmb K(k)\pmb R(k)=0\tag{4}$

整理可得
$\pmb K(k)=\pmb P(k-1)\pmb H^T(k)\Big[\pmb R(k)+\pmb H(k)\pmb P(k-1)\pmb H^T(k)\Big]^{-1}\tag{5}$

这个答案初看起来令人惊讶，和已经得到的滤波增益 $\pmb K(k)=\pmb M_k\pmb H^T(k)\pmb R^{-1}(k)$ 是不同的，一个包含 $Mk \pmb M_k$ ，另一个包含 $\pmb P(k-1)$ 。但下面2个结论（证明方法见附录（有空再补充吧））却表明这两个公式是等价的。

若考虑 $\pmb W(k)=\pmb R^{-1}(k)$ ，则 $Mk \pmb M_k$ 实际上是估计方差 $\pmb P(k)$ ，按照式（1），估计方差也满足 $\pmb P^{-1}(k)=\pmb P^{-1}(k-1) + \pmb H^T(k)\pmb R^{-1}(k)\pmb H(k)$ 。
若用 $\pmb P(k)$ 来代替式（1）中的 $Mk \pmb M_k$ ，则式（5）所表达的滤波增益是等价的。

到这里，可以得到如下结论，利用最小二乘性能指标得到的估计方法:
$\hat{\pmb\theta}(k)=\hat{\pmb\theta}(k-1)+\pmb K(k)\left[Z(k)-\pmb H(k)\hat{\pmb\theta}(k-1) \right]\tag{6}$

可以得到最小的估计方差 $\pmb P(k)$ ，其中滤波增益 $\pmb K(k)$ 有以下两种不同的计算方法：
$\begin{aligned} \pmb K(k)&=\pmb M_k\pmb H^T(k)\pmb R^{-1}(k)\\[1ex] \pmb K(k)=\pmb P(k-1)\pmb H^T&(k)\Big[\pmb R(k)+\pmb H(k)\pmb P(k-1)\pmb H^T(k)\Big]^{-1} \end{aligned}\tag{7}$

估计方差 $\pmb P(k)$ 可以使用如下两种求法来计算：
$\pmb P(k)=\Big[\pmb P^{-1}(k-1) + \pmb H^T(k)\pmb R^{-1}(k)\pmb H(k)\Big]^{-1}\tag{8}$

$\pmb P(k)=\Big[\pmb I-\pmb K(k)\pmb H(k)\Big]\pmb P(k-1)\Big[\pmb I-\pmb K(k)\pmb H(k)\Big]^T + \pmb K(k)\pmb R(k)\pmb K^T(k)\tag{9}$

在附录中还提到了下面的估计方差 $\pmb P(k)$ 计算方法：
$\pmb P(k)=\Big[\pmb I-\pmb K(k)\pmb H(k)\Big]\pmb P(k-1)\tag{10}$

在上面的三个计算 $\pmb P(k)$ 的公式中，式（10）是一个比较简单的表达式，但是数值计算问题可能导致 $\pmb P(k)$ 不是正定的，即使 $\pmb P(k-1)$ 和 $\pmb R(k)$ 都是正定的。式（9）虽然复杂，但是却可以保证 $\pmb P(k)$ 是正定的，与理论解一致，而式（8）需要三次矩阵求逆计算，因此计算复杂，需要占用更多的计算资源，但在多传感器状态融合估计中可以使融合公式具有统一形式，所以经常在状态融合估计方法中使用。

EasonZzzzzzz

关注

8
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
最小二乘估计（3）

是正定的，与理论解一致，而式（8）需要三次矩阵求逆计算，因此计算复杂，需要占用更多的计算资源，但在多传感器状态融合估计中可以使融合公式具有统一形式，所以经常在状态融合估计方法中使用。定量描述估计的误差，估计方差是一个很关键的评价指标。本节给出几种最小二乘方法滤波增益和估计方差的求解方法，这些也是卡尔曼滤波器的理论基础。的公式中，式（10）是一个比较简单的表达式，但是数值计算问题可能导致。一般可以认为，所得的估计方差越小，估计方法就越好。，称其为滤波增益，将上式代入估计方差的定义，可以得到。
复制链接

扫一扫

专栏目录