两个高斯分布乘积的理论推导

程序猿小怪兽

已于 2023-03-18 22:37:29 修改

阅读量4.3w

点赞数 130

分类专栏：概率机器人文章标签：概率论算法线性代数

于 2020-06-23 17:03:39 首次发布

本文链接：https://blog.csdn.net/chaosir1991/article/details/106910668

版权

概率机器人专栏收录该内容

3 篇文章 17 订阅

订阅专栏

本文主要推导高斯分布（正态分布）的乘积，以便能更清楚的明白Kalman滤波的最后矫正公式。

Kalman滤波主要分为两大步骤：
1.系统状态转移估计，2.系统测量矫正；
在第2步中的主要理论依据就是两个独立高斯分布的乘积如何计算的问题，即如何融合 估计值 和 观测值 得到系统状态的最优估计。

高斯分布的概率密度函数：
$\frac{1}{\sqrt{2\pi}\delta}{e^{-\frac{(x-u)^2}{2\delta^2}}} \tag{1}$
其本质问题可抽象为：已知两个独立高斯分布 $N_1∼(u_1, \delta_1^2)$ , $N_2∼(u_2, \delta_2^2)$ ，求新的概率分布 $=N_1\times N_2∼(?,?)$

在进行理论推导之前，我们先通过Matlab数值计算看看两独立概率分布的乘积情况：
在这里插入图片描述如图所示绿色和红色分别代表两个独立的高斯分布函数，蓝色为两个分布的乘积，从蓝色形状可以粗略的看出乘积结果可能为一个幅值被压缩的高斯分布，其期望在 $u_1,u_2]$ 之间，但是真实是否如此还需理论推导。

$N_1$ 的概率分布函数为 $f_1(x)$ , $N_2$ 的概率分布函数为 $f_2(x)$ , 则：
$\begin{aligned} f_1(x)f_2(x) &=\frac{1}{\sqrt{2\pi}\delta_1}{e^{-\frac{(x-u_1)^2}{2\delta_1^2}}}\cdot\frac{1}{\sqrt{2\pi}\delta_2}{e^{-\frac{(x-u_2)^2}{2\delta_2^2}}}\\\\ &=\frac{1}{2\pi \delta_1\delta_2}{e^{-\bigg(\frac{(x-u_1)^2}{2\delta_1^2}+\frac{(x-u_2)^2}{2\delta_2^2}\bigg)}} \end{aligned} \tag{2}$
可以直接先单独分析指数部分，设：
$\begin{aligned} \beta &=\frac{(x-u_1)^2}{2\delta_1^2}+\frac{(x-u_2)^2}{2\delta_2^2}\\\\ &=\frac{(\delta_1^2+\delta_2^2)x^2-2(u_2\delta_1^2+u_1\delta_2^2)x+(u_1^2\delta_2^2+u_2^2\delta_1^2)}{2\delta_1^2\delta_2^2}\\\\ &=\frac{x^2-2\frac{u_2\delta_1^2+u_1\delta_2^2}{\delta_1^2+\delta_2^2}x+\frac{u_1^2\delta_2^2+u_2^2\delta_1^2}{\delta_1^2+\delta_2^2}}{\frac{2\delta_1^2\delta_2^2}{\delta_1^2+\delta_2^2}}\\\\ \text{构造新的正态分布}&=\frac{\bigg(x-\frac{u_2\delta_1^2+u_1\delta_2^2}{\delta_1^2+\delta_2^2}\bigg)^2+\frac{u_1^2\delta_2^2+u_2^2\delta_1^2}{\delta_1^2+\delta_2^2}-\bigg(\frac{u_2\delta_1^2+u_1\delta_2^2}{\delta_1^2+\delta_2^2}\bigg)^2}{\frac{2\delta_1^2\delta_2^2}{\delta_1^2+\delta_2^2}}\\\\ &=\underbrace{\frac{\bigg(x-\frac{u_2\delta_1^2+u_1\delta_2^2}{\delta_1^2+\delta_2^2}\bigg)^2}{\frac{2\delta_1^2\delta_2^2}{\delta_1^2+\delta_2^2}}}_{\gamma}+\underbrace{\frac{\frac{u_1^2\delta_2^2+u_2^2\delta_1^2}{\delta_1^2+\delta_2^2}-\bigg(\frac{u_2\delta_1^2+u_1\delta_2^2}{\delta_1^2+\delta_2^2}\bigg)^2}{\frac{2\delta_1^2\delta_2^2}{\delta_1^2+\delta_2^2}}}_{\lambda} \end{aligned} \tag{3}$
设 $\lambda$ 如上所示，则 $\beta=\gamma+\lambda$ ,其中 $\gamma$ 为一个 $\delta^2)$ 的正态分布， $\lambda$ 为一个常数值。继续简化 $\lambda$ ，如下：
$\begin{aligned} \lambda &=\frac{\frac{u_1^2\delta_2^2+u_2^2\delta_1^2}{\delta_1^2+\delta_2^2}-\bigg(\frac{u_2\delta_1^2+u_1\delta_2^2}{\delta_1^2+\delta_2^2}\bigg)^2}{\frac{2\delta_1^2\delta_2^2}{\delta_1^2+\delta_2^2}}\\\\ &=\frac{(u_1^2\delta_2^2+u_2^2\delta_1^2)(\delta_1^2+\delta_2^2)-(u_2\delta_1^2+u_1\delta_2^2)^2}{2\delta_1^2\delta_2^2(\delta_1^2+\delta_2^2)}\\\\ &=\frac{(u_1^2\delta_2^2\delta_1^2+u_2^2\delta_1^4+u_2^2\delta_2^2\delta_1^2+u_1^2\delta_2^4)-(u_2^2\delta_1^4+2u_1u_2\delta_1^2\delta_2^2+u_1^2\delta_2^4)}{2\delta_1^2\delta_2^2(\delta_1^2+\delta_2^2)}\\\\ &=\frac{\delta_1^2\delta_2^2(u_1^2+u_2^2-2u_1u_2)}{2\delta_1^2\delta_2^2(\delta_1^2+\delta_2^2)}\\\\ &=\frac{(u_1-u_2)^2}{2(\delta_1^2+\delta_2^2)} \end{aligned} \tag{4}$
则可得两个高斯分布相乘为：
$\begin{aligned} f_1(x)f_2(x) &=\frac{1}{2\pi \delta_1\delta_2}{e^{-\beta}}=\frac{1}{2\pi \delta_1\delta_2}{e^{-(\gamma+\lambda)}}\\\\ &=\frac{1}{2\pi \delta_1\delta_2}{e^{-\gamma}\cdot e^{-\lambda}}\\\\ &=\frac{1}{2\pi \delta_1\delta_2}{e^{-\frac{(x-u)^2}{2\delta^2}}}\cdot e^{-\frac{(u_1-u_2)^2}{2(\delta_1^2+\delta_2^2)}} \end{aligned} \tag{5}$
其中：
$u=\frac{u_2\delta_1^2+u_1\delta_2^2}{\delta_1^2+\delta_2^2},\ \ \ \ \ \ \delta^2=\frac{\delta_1^2\delta_2^2}{\delta_1^2+\delta_2^2}\tag{6}$
把常数项综合为 $S_g$ 可得其直观表达方式：
$\begin{aligned} f_1(x)f_2(x) &=S_g\cdot\frac{1}{\sqrt{2\pi} \delta}{e^{-\frac{(x-u)^2}{2\delta^2}}} \end{aligned} \tag{7}$
$S_g=\frac{1}{\sqrt{2\pi(\delta_1^2+\delta_2^2)}}e^{-\frac{(u_1-u_2)^2}{2(\delta_1^2+\delta_2^2)}}\tag{8}$
到此，两个高斯分布相乘的分布函数即推导出来，即相乘后的分布函数为一个被压缩或者放大的高斯分布， $S_g$ 为缩放因子，相乘后的概率密度的积分不等于1，但其方差和均值性质不变，所以 $=N_1\times N_2∼(u,\delta^2)$ ，也就是我们常说两个高斯分布相乘同样服从高斯分布。

在Kalman滤波中的系统矫正环节中，实际是融合估计值和观测值，使用Kalman滤波都是假设这两者的分布服从高斯分布，各有各的期望和方差。计算Kalman的最优估计的本质就是在计算合成的 $u$ 。

这里我们再研究一下缩放因子 $S_g$ 。可以看出，

① 当 $S_g<1$ 时，概率分布被压缩；
② 当 $S_g>1$ 时，概率分布被放大；

平时我们大多数情况下会看到情况①，那什么情况下才能出现情况②呢？？？
进行如下分部分析：
$S_g=\frac{1}{\sqrt{2\pi(\delta_1^2+\delta_2^2)}}e^{-\frac{(u_1-u_2)^2}{2(\delta_1^2+\delta_2^2)}}=\frac{p(x)}{q(x)}\tag{9}$

其中：
$p(x)=exp\bigg(-\frac{(u_1-u_2)^2}{2(\delta_1^2+\delta_2^2)}\bigg),\ \ \ q(x)=\sqrt{2\pi(\delta_1^2+\delta_2^2)}\tag{10}$

可以很容易的得到 $p (x) > 0$ , $q (x) > 0$ ，当 $S_g<1$ 时， $p (x) < q (x)$ , 当 $S_g>1$ 时， $p (x) > q (x)$ , 因此这里问题转化为判断 $p (x), q (x)$ 的大小。

设自变量 $x=\delta_1^2+\delta_2^2$ ， $N=(u_1-u_2)^2$ ，则 $x > 0$ ， $N > 0$
$p(x)=exp\bigg(-\frac{N}{2x}\bigg),\ \ \ q(x)=\sqrt{2\pi x}\tag{11}$

如下是仿真计算： $q (x)$ 是条固定的曲线， $p (x)$ 是根据N移动的曲线蔟，大多数情况会出现 $p (x) < q (x)$ （情况①）
在这里插入图片描述可以看出当 $p (x), q (x)$ 只有一个交点时，即是一个情况②可能出现的临界，(这个临界 $N_k$ 我没有计算出来，但仿真差不多在0.06附近，暂且就这样认为吧)， $N$ 越小曲线越靠右，就会出现局部 $p (x) > q (x)$ 的情况。

可以得出如下结论：

当 $N > 0.06$ 时，不可能出现情况②
当 $0 < N < 0.06$ 时，且 $a < x < b$ （其中 $a ， b$ 为两交点， $a>0,b<\frac{1}{2\pi}$ ），出现情况②
我们手动仿真了一些情况，如下

当可以通过 $S_g$ 来判断当前的融合概率是否是被增强还是削弱时，我们是否也可以同时用来判断融合的有效性。在机器人定位中，利用Kalman融合后，可以利用 $S_g$ 判断定位融合是否有效。

预测和测量相差很远时， $S_g$ 就变小，融合分布概率分散，真实位置概率变小；
预测和测量相差很近时，且方差很小时，融合分布概率更集中，真实位置概率变大

如此我们可以设置一个阈值来判断当前融合的有效性。

程序猿小怪兽

关注

130
点赞
踩
378

收藏

觉得还不错? 一键收藏
37
评论
两个高斯分布乘积的理论推导

本文主要推导高斯分布（正态分布）的乘积，以便能更清楚的明白Kalman滤波的最后矫正公式。Kalman滤波主要分为两大步骤：1.系统状态转移估计，2.系统测量矫正；在第2步中的主要理论依据就是两个独立高斯分布的乘积如何计算的问题，即如何融合估计值和观测值得到系统状态的最优估计。高斯分布的概率密度函数：f(x)=12πδe−(x−u)22δ2(1) f(x) = \frac{1}{\sqrt{2\pi}\delta}{e^{-\frac{(x-u)^2}{2\delta^2}}} \ta
复制链接

扫一扫

专栏目录