误差、方差、协方差的传播

最新推荐文章于 2024-04-04 10:40:40 发布

leida_wt

最新推荐文章于 2024-04-04 10:40:40 发布

阅读量1.1w

点赞数 11

分类专栏：控制理论与控制工程文章标签：协方差传播误差传播方差传播

本文链接：https://blog.csdn.net/leida_wt/article/details/104328506

版权

控制理论与控制工程专栏收录该内容

3 篇文章

订阅专栏

文章目录

0. 绝对误差与相对误差
- 0.1绝对误差（简称误差）：
- 0.2相对误差
1. 误差的传播
2. 方差传播
- 2.1 简单线性函数
- 2.2 复杂函数
3. 协方差传播
4. 参考文献

0. 绝对误差与相对误差

一般的，称 $x^*$ 为准确值 $x$ 的一个近似值，可定义以下两种常用误差:

0.1绝对误差（简称误差）：

绝对误差（简称误差）: $e(x^*)=x-x^*$
为方便起见，取其一上界 $\epsilon$ 使满足 $|x-x^*|\le\epsilon$ （这个上界不唯一），由此我们最常见的误差写法就可写成 $x=x^*\pm\epsilon$ ，即准确值 $x$ 必在区间 $[x^*-\epsilon,x^*+\epsilon]$ 内。

0.2相对误差

考虑真值本身的数量大小，相对误差是衡量精度的更好指标，定义为：
$e_r(x^*)=\frac{x-x^*}{x}$ ，相似的，我们亦可取一个上界为 $\epsilon_r$ ，称之为相对误差限。

1. 误差的传播

误差的传播系指分析在形如 $y=f(x_1,x_2,...,x_n)$ 的关系中，参量误差对变量误差的影响有多大。误差的传播与函数的微分紧密相关，本质是在利用当 $\Delta x$ 不大时， $\Delta y\approx \frac{\partial f}{\partial x}\Delta x$ 。
若 $f$ 在 $x^*_1,...x^*_n)$ 可微，则不难得到:
在这里插入图片描述

这实际上就是一阶泰勒展开。多变量泰勒公式为：
$f(x)=f(\bf{a})+\nabla{f(\bf{a})\cdot(\bf{x}-\bf{a})}+...$
移项，令 $\bf a$ 为 $x^*_1,...x^*_n)$ 并带入 $e(x^*)=x-x^*$ ， $e(y^*)=y-y^*$ 即可得误差公式。
按照上面的式子求导，可给出最常见和差积商误差公式：
在这里插入图片描述
相应的，误差限可如下给出：

2. 方差传播

仍考虑形如 $y=f(x_1,x_2,...,x_n)$ 的关系，方差传播既是通过 $x_1,x_2,...,x_n)$ 的不确定度分析 $y$ 的不确定度。该问题有时也称为方差的合成。

2.1 简单线性函数

对于简单的函数关系（如加减等），这个方差传播既可用“随机变量函数的分布”这一手段予以求解。即已知随机变量 X 及它的分布，如何求其函数 $Y = g (X)$ 的分布。这是本科概率统计课程的经典内容，不再赘述，通过累次积分可处理形如 $Z = X + Y$ 这类简单形式的概率密度，之后便可求均值方差等所有统计量。

2.2 复杂函数

对绝大多数函数，尤其是非线性函数，一般只能寻求其期望和方差的近似求法。这里解决问题的工具依旧是泰勒展开。
先考虑简单的一维情形：设随机变量 $X$ ，其期望和方差分别为 $\mu,\sigma^2$ ，变量 $Y = g (X)$ 是其函数。则有：
在这里插入图片描述
证明此关系只需将 $Y$ 在 $\mu$ 处局部线性化即可。

相似的，方差公式的证明可进行一阶展开后得到。虽避免了求积分，但此处导数往往也得不到解析解，可通过数值差分近似导数得到（一般倾向于使用中心差分公式）。

再看二维情形。一维到二维是一个质变，从两个变量开始，变量相关性和协方差的概念被引入。设随机变量向量 $X,Y]^T$ 中的变量 $X, Y$ 的期望，方差分别为 $\mu _x, \mu _y, \sigma _x^2, \sigma _y^2$ ，并设二元函数 $Z = g (X, Y)$ 。则仍仿照上面单变量的方法，将 $Z$ 在自变量期望处进行局部线性化然后两边同取期望/方差即可，只不过换为了多变量的泰勒展开。
注：多变量泰勒展开
在这里插入图片描述
更常见的是向量形式：

最后结果是：

可以看到依赖于变量的协方差。
除了上面直接将函数局部线性化的方法，亦可以使用类似“自底向下”的方法，从方差原始定义入手得到上面的结果。
仍设随机变量 $X$ 及其一组观测 ${X_1,X_2,...X_n\}$ , $Y$ 及其一组观测 ${Y_1,Y_2,...Y_n\}$ ，他们的期望，方差分别为 $\mu _x, \mu _y, \sigma _x^2, \sigma _y^2$ ，二元函数 $Z = g (X, Y)$ 。
则按方差定义
$\sigma_Z=\frac{1}{n-1}\sum_{i=1}^{n}{(Z_i-\bar Z)^2}$

通过对 $Z = g (X, Y)$ 在期望处求一阶泰勒展开，可知 $Z_i-\bar Z=(X_i-\bar X)\frac{\partial g}{\partial X}+(Y_i-\bar Y)\frac{\partial g}{\partial Y}$ 带回上式，并带入协方差定义： $cov(X,Y)=\frac{1}{n-1}\sum_{i=1}^{n}(X_i-\bar X)(Y_i-\bar Y)$

可化简得：

$\sigma_Z^2=\frac{1}{n-1}\sum_{i=1}^{n}[(X_i-\bar X)\frac{\partial g}{\partial X}+(Y_i-\bar Y)\frac{\partial g}{\partial Y}]^2$

$=\sigma_x^2(\frac{\partial g}{\partial X})^2+\sigma_y^2(\frac{\partial g}{\partial Y})^2+2cov(X,Y)\frac{\partial g}{\partial X}\frac{\partial g}{\partial Y}$

写成向量形式即为：
$\sigma_Z^2=J\Sigma J^T$

其中 $J=[\frac{\partial g}{\partial X},\frac{\partial g}{\partial Y}]$ 为Jacobian matrix,
中间 $\Sigma$ 是协方差矩阵
在这里插入图片描述
一些计算实例：

对于线性函数和二次函数, 由于其二阶以上各阶导数为0, 近似计算公式与严密计算公式等价。对于非线性更强的函数，由于我们是以期望为中心展开的， $X_i$ 很多时候并不在展开点 $\bar X$ “附近”，会有不小的误差，可适时地考虑使用蒙特卡洛模拟暴力计算得到更优的结果。
一个常被用于测试的强非线性函数是 $Z=Xe^Y$ ，图像长这样：
在这里插入图片描述

3. 协方差传播

当上面问题中的函数值域亦是多维的，方差传播就升格为协方差传播。
先看线性情形，设多维随机变量X:
在这里插入图片描述
设 $Z=[k_1,k_2,...,k_n]X+k_0$ 为 $X$ 的一线性函数，根据前面方差传播的知识可知有：
$E(Z)=K\mu_x+k_0 ; D_{ZZ}=KD_{XX}K^T$

将其中的 $Z$ 扩展到多维，即设 $Z=[z_1,z_2,...,z_t]^T$ ，其中每个 $z_i$ 均是 $X$ 的线性函数（ $z_i=[k_{i,1},...,k_{i,n}]X_i$ ）
那么对:
$Z=KX+K_0$

其中 $K$ 为 $t * n$ 矩阵， $K_0$ 为 $t * 1$ 矩阵，依旧有相同的结论：
$E(Z)=K\mu_x+k_0 ; D_{ZZ}=KD_{XX}K^T$

只不过这里 $D_{ZZ}$ 升格为了 $t * t$ 矩阵，称之为协方差传播。
若另有Y：
在这里插入图片描述
并有关于 $Y$ 的函数 $W=FY+F_0$ ，则相似的可获知一系列关系常用协方差传播律：
$D_{ZZ}=KD_{XX}K^T$
$D_{WW}=FD_{YY}F^T$
$D_{ZW}=KD_{XY}F^T$
$D_{WZ}=FD_{YX}K^T$

4. 参考文献

https://www.cnas.org.cn/fwzl/images/tc261sc1sysrkfjswyh/tzgg/2015/03/24/70E459F9EA361F6C3F4C675277B5CF3C.pdf
https://wenku.baidu.com/view/960f3cd7b8f67c1cfbd6b826.html
https://wenku.baidu.com/view/4d8b1945581b6bd97f19eaab.html
https://www.ucl.ac.uk/~ucfbpve/geotopes/indexch10.html
概率论与数理统计教程(茆诗松)