Apollo学习笔记（28）贝叶斯滤波

最新推荐文章于 2023-11-16 03:55:28 发布

碎步の流年

最新推荐文章于 2023-11-16 03:55:28 发布

阅读量298

点赞数

分类专栏： Apollo 文章标签：学习概率论算法

本文链接：https://blog.csdn.net/qq_24649627/article/details/125806089

版权

Apollo 专栏收录该内容

29 篇文章 119 订阅

订阅专栏

本来是准备计划整粒子滤波的，但是粒子滤波的前提是贝叶斯滤波，所以就找了几篇大佬的贝叶斯拜读了一下，现在做个整理。首先，奉上大佬链接，下面是自己整理的。

1.二维随机变量的条件分布

假设有 $(X, Y)$ 是二维离散型随机变量，其联合概率密度函数为
$p_{ij}=P(X=x_{i},Y=y_{j}),\enspace i,j=1,2,3,\ldots \tag{1}$
在 $Y = y$ 条件下的随机变量 $X$ 的条件概率函数为，
$p_{\tiny {X|Y}}(x_{i}|y)=P(X=x_{i}|Y=y)=\frac{P(Y=y,X=x_{i})}{P(Y=y)}=\frac{P(Y=y|X=x_{i})P(X=x_{i})}{P(Y=y)} \tag{2}$

通过全概率公式将式(2)的分母展开，即可得到离散型随机变量的贝叶斯公式，
$p_{\tiny {X|Y}}(x_{i}|y)=\frac{P(Y=y|X=x_{i})P(X=x_{i})}{\textstyle\sum_{j=1}^n P(Y=y|X=x_{j})P(X=x_{j})},\enspace j=1,2,3,\ldots \tag{3}$

2.二维连续型随机变量的条件分布

连续型随机变量的概率在 $Y = y$ 时， $P (Y = y)$ 的概率为0，所以通过条件概率的定义无法进行连续型随机变量的条件分布求解。

只能用极限的思路做一点变形进行求解，假设 $y<Y<y+\Delta y$ ，将连续型随机变量的条件分布从一点转化为在一个区间的概率分布，当然有 $\Delta y \rarr 0$ ，则对于连续型随机变量的概率分布函数为
$\begin{aligned} F_{\tiny {X|Y}}(x|y)&=\lim \limits_{\Delta y \rarr 0} P(X \le x|y \lt Y \lt y+\Delta y) \\ &= \lim \limits_{\Delta y \rarr 0} \frac{P(X \le x,y \lt Y \lt y+\Delta y)}{P(y \lt Y \lt y+\Delta y)} \\ &= \lim \limits_{\Delta y \rarr 0} \frac{\int^{x}_{-\infin}\int^{y+\Delta y}_{y}p(x,y)dydx}{\int^{y+\Delta y}_{y}p_{\tiny{Y}}(y)dy} \\ &= \lim \limits_{\Delta y \rarr 0} \frac{\int^{x}_{-\infin}p(x,y+\varepsilon_{0}\Delta y)\Delta ydx}{p_{\tiny{Y}}(y+\varepsilon_{1}\Delta y)\Delta y} \enspace (0<\varepsilon_{0} < 1,0<\varepsilon_{1} < 1) \\ &=\lim \limits_{\Delta y \rarr 0} \frac{\int^{x}_{-\infin}p(x,y+\varepsilon_{0}\Delta y)dx}{p_{\tiny{Y}}(y+\varepsilon_{1}\Delta y)} \tag{4} \end{aligned}$

由于有 $\lim \limits_{\Delta y \rarr 0}$ ，且 $Y$ 是连续随机变量，所以把 $\varepsilon_{0}\Delta y=0,\varepsilon_{1}\Delta y=0$ 代入式(4)有
$F_{\tiny {X|Y}}(x|y)=\frac{\int^{x}_{-\infin}p(x,y)dx}{p_{\tiny{Y}}(y)} \tag{5}$

对式(5)右侧进行求导，可以得到 $Y = y$ 条件下 $X$ 的条件概率密度函数
$p_{\tiny {X|Y}}(x|y)=\frac{p(x,y)}{p_{\tiny{Y}}(y)}=\frac{p(y|x)p_{\tiny{X}}(x)}{p_{\tiny{Y}}(y)}=\frac{p(y|x)p_{\tiny{X}}(x)}{\int^{+\infin}_{-\infin}p(y|x)p(x)dx} \tag{6}$
可以看出式(3)和式(6)很相似，其实仔细琢磨下会发现思路都是一样的。

另外可以看出， $p_{\tiny{Y}}(y)$ 与 $x$ 的取值无关，因此经常会出现使用 $\eta$ 来表示 $p_{\tiny{Y}}(y)^{-1}$ 的情况，如下
$p_{\tiny {X|Y}}(x|y)=\frac{p(y|x)p_{\tiny{X}}(x)}{p_{\tiny{Y}}(y)}=\eta p(y|x)p_{\tiny{X}}(x) \tag{7}$

3.状态估计

状态估计就是根据获取到的测量数据以及系统之前的状态方程来估算当前系统状态的方法。

传感器测量的数据一般都是离散的，即 $t = 0, 1, 2, 3, 4...$ ，相应的，设定对应的观测值为 $y_{1},y_{2},y_{3},y_{4}...$ ，控制输入为 $u_{1},u_{2},u_{3},y_{4}...$ ，状态为 $x_{0},x_{1},x_{2},x_{3},x_{4}...$ （x_0为初始状态）。

4.马尔可夫假设

隐马尔可夫模型(Hidden Markov Model)有两个基本假设：

齐次马尔可夫假设
观测独立假设

齐次马尔可夫假设

马尔可夫假设，简单来说，就是根据上一时刻的状态和控制输入可以预测当前的系统状态。（这里是不是感觉和MPC的思想很相似）

取三个时刻：上一时刻(t-1)，当前时刻(t)，下一时刻(t+1)。

根据马尔可夫假设，现在的状态 $x_t$ 是由上一时刻的状态 $x_{t-1}$ 和当前时刻的控制输入 $u_t$ 决定，下一时刻的状态 $x_{t+1}$ 也类似。

观测独立假设

具体是指，任一时刻的观测只依赖于该时刻的马尔可夫链的状态，与其他观测无关。

这两个假设非常重要，根据马尔可夫假设，才能推导出递归贝叶斯的更新公式。

5.贝叶斯滤波的推导

贝叶斯公式

单条件贝叶斯公式
$p(x|y)=\frac{p(y|x)p(x)}{\int_{-\infin}^{+\infin}p(y|x)p(x)dx}=\eta p(y|x)p_{\tiny{X}}(x) \tag{8}$

多条件贝叶斯公式

$\begin{aligned} p(x|y,z)&=\frac{p(y,z|x)p(x)}{p(y,z)} \\ &=\frac{\frac{p(x,y,z)}{p(x)}p(x)}{p(y|z)p(z)} \\ &=\frac{\frac{p(x,y,z)}{p(x,z)}\frac{p(x,z)}{p(x)}p(x)}{p(y|z)p(z)} \\ &=\frac{p(y|x,z)p(z|x)p(x)}{p(y|z)p(z)} \\ &=\frac{p(y|x,z)p(x,z)}{p(y|z)p(z)} \\ &=\frac{p(y|x,z)p(x|z)p(z)}{p(y|z)p(z)} \\ &=\frac{p(y|x,z)p(x|z)}{p(y|z)} \\ &=\eta p(y|x,z)p(x|z) \\ \end{aligned} \tag{9}$

由贝叶斯公式推导贝叶斯滤波

在推导公式之前，先说下先验概率、后验概率、似然概率还有边缘概率。

先验概率：在结果发生之前，根据历史规律确定原因的概率分布；
似然概率：根据原因来估计结果的概率分布，就是似然估计；
后验概率：根据结果来估计原因的概率分布，就是后验概率；
边缘概率：结果发生的概率，叫做边缘概率。

光这么说，是不是有点晕，可以看看大佬的博客，会理解的更详细点。

对于做定位的来说，

$p\tiny{(位姿)}$ ，就是先验概率，根据经验推测产生位姿的概率，记做 $P (A)$ ；
$p\tiny{(位姿|传感器和运动信息)}$ ，后验概率，在知道传感器和运动信息的条件下，产生某个位姿的概率，记为 $P (A ∣ B)$ ；
$p\tiny{(传感器和运动信息|位姿)}$ ，似然概率，在知道确定的位姿的条件下，曾经发生某些传感器信息或者运动的概率，记为 $P (B ∣ A)$
$p\tiny{(传感器和运动信息)}$ ，边缘密度，传感器发出某些信息或者发生某些运动的概率，记为 $P (B)$

7.随机过程的贝叶斯滤波

在机器人定位或者无人驾驶的定位中，对车辆或者机器人的运动估计就是一个随机过程。轨迹过程彼此之间并不是独立的，其符合马尔科夫链，如下所示：

其中 $X 0$ 为初始值，一般由经验确定（先验）。那么如何从初始状态 $X 0$ ，加上观测信息，从而估计到 $k$ 时刻的状态 $X k$ ，同时又保证估计值的精度呢？

方法1：所有的 $X 0$ ~ $X k$ 的先验概率都靠观测值，完全忽略了根据系统模型的预测值。这样做的缺点也很明显，完全依赖观测值，放弃使用预测信息，使得估计值的误差就是传感器的误差。

方法2：其中 $X 0$ 是靠先验猜测，其余的 $X １$ ~ $X k$ 均靠系统模型的递推，此时，随着递推的次数增加，估计值的误差会一直增加，假设有系统状态方程 $X_k=2X_{k-1}$ ，则有
$\begin{aligned} X_{1}&=2X_{0} \backsim N(0,2^{2}) \\ X_{2}&=2X_{1} \backsim N(0,2^{4}) \\ \cdots \\ X_{k}&=2X_{k-1} \backsim N(0,2^{k}) \\ \end{aligned}$

可以发现，如果只通过系统状态方程进行预测，误差会在不断的迭代过程中，导致方差会越来越大，这样明显是不想见到的结果。

这两种方式都各有各的问题，下面来看一下一种把系统状态方程和观测方程的提高准确度的方法。

在这里插入图片描述
预测：上一时刻的后验概率，结合系统状态方程，计算出这一时刻的先验概率
更新：这一时刻的先验概率，结合观测方程，计算出这一时刻的后验概率（下一时刻的先验概率）

这种思路和卡尔曼滤波是一样的，下面进行详细的推导：

已知，系统的状态方程和观测方程为
$\begin{cases} X_{k}=f(X_{k-1})+Q_{k} \\ Y_{k}=h(X_{k})+R_{k} \\ \end{cases} \tag{10}$

上式中， $X_{0},Q_{1}\ldots Q_{k},R_{1}\ldots R_{k}$ 相互独立，观测值 $y_{1},y_{2}\ldots y_{k}$ 已知，初始状态量 $X_{0}$ ，预测方差 $Q_{k}$ ，和观测方差 $R_{k}$ 都是已知。

下面给出一个重要定理：条件概率的条件可以做逻辑推导，比如：
$P (X = 1∣ Y = 2, Z = 3) = P (X + Y = 3∣ Y = 2, Z = 3) = P (X + Y = 3∣ Y = 2, Z - Y = 1)$

预测步推导

首先，要通过前一时刻 $k - 1$ 的系统状态来预测当前 $k$ 时刻的系统状态，得到 $f^{-}_{k}(x)$ ，也就是求先验值
$f^{-}_{k}(x)=\frac{dP(X_{k}<x)}{dx} \tag{11}$

要求解 $f_{k}(x)$ ，必须要先求解出 $P(X_{k}<x)$ ，求解方式与第一部分讲的随机变量的条件分布类似，如下
$P(X_{k}<x)=\displaystyle\sum_{u=-\infin}^{x}P(X_{k}=u) \tag{12}$
式中， $u$ 为连续取值。
$\begin{aligned} P(X_{k}=u)&=\displaystyle\sum_{v=-\infin}^{+\infin}P(X_{k}=u|X_{k-1}=v)P(X_{k-1}=v) \\ &=\displaystyle\sum_{v=-\infin}^{+\infin}P[X_{k}-f(X_{k-1})=u-f(v)|X_{k-1}=v]P(X_{k-1}=v) \\ &=\displaystyle\sum_{v=-\infin}^{+\infin}P[Q_{K}=u-f(v)|X_{k-1}=v]P(X_{k-1}=v) \\ &=\displaystyle\sum_{v=-\infin}^{+\infin}P[Q_{K}=u-f(v)]P(X_{k-1}=v) \\ &=\lim\limits_{\varepsilon \to 0}\displaystyle\sum_{v=-\infin}^{+\infin} f_{Q_{k}}[u-f(v)] \varepsilon f_{k-1}(v)\varepsilon \\ &=\lim\limits_{\varepsilon \to 0}\displaystyle\int_{-\infin}^{+\infin} f_{Q_{k}}[u-f(v)] f_{k-1}(v) \varepsilon^{2} \end{aligned} \tag{13}$

到此，对上式进行下解释，不然不太好理解。

第二步，是因为条件概率的逻辑条件可以做逻辑推导，所以可以这么写。

第三步，参考公式(10)。

第四步，因为 $Q_{K}$ 和 $X_{k-1}$ 相互独立，所以可以将第一项的条件去掉。

第五步，这里把连续型贝叶斯公式推导下，
$\begin{aligned} P(X<x|Y=y)&=\displaystyle\sum_{u=-\infin}^{x}P(X=u|Y=y)=\displaystyle\sum_{u=-\infin}^{x} \frac{P(Y=y|X=u)P(X=u)}{P(Y=y)} \\ &=\lim \limits_{\varepsilon \to 0} \displaystyle\sum_{u=-\infin}^{x} \frac{P(y<Y<y+\varepsilon|X=u)P(u<X<u+\varepsilon)}{P(y<Y<y+\varepsilon)} \\ &=\lim \limits_{\varepsilon \to 0} \displaystyle\sum_{u=-\infin}^{x} \frac{f_{Y|X}(\eta_{1}|u)\cdot \varepsilon \cdot f_{X}(\eta_{2}) \cdot \varepsilon}{f_{Y}(\eta_{3}) \cdot \varepsilon} \\ &=\lim \limits_{\varepsilon \to 0} \displaystyle\sum_{u=-\infin}^{x} \frac{f_{Y|X}(y|u) \cdot f_{X}(u) \cdot \varepsilon}{f_{Y}(y)} \\ &=\int^{x}_{-\infin}\frac{f_{Y|X}(y|u) \cdot f_{X}(u)}{f_{Y}(y)}du \\ &=\int^{x}_{-\infin}\frac{f_{Y|X}(y|x) \cdot f_{X}(x)}{f_{Y}(y)}dx \\ \end{aligned} \tag{14}$

又因为，
$\int^{x}_{-\infin}f_{X|Y}(x|y)dx$

因此，式（14）可以化为，
$\int^{x}_{-\infin}f_{X|Y}(x|y)dx=\int^{x}_{-\infin}\frac{f_{Y|X}(y|x) \cdot f_{X}(x)}{f_{Y}(y)}dx \tag{15}$

所以，对于连续型随机变量，贝叶斯公式同样适用，
$f_{X|Y}(x|y)dx=\frac{f_{Y|X}(y|x) \cdot f_{X}(x)}{f_{Y}(y)}dx \tag{16}$

好，这里继续式（13）后，继续推，

$\begin{aligned} P(X_{k}<x)&=\displaystyle \sum_{u=-\infin }^{x}P(X_{k}=u)=\displaystyle\sum_{u=-\infin}^{x} \lim \limits_{\varepsilon \to 0} \int^{+\infin}_{-\infin}f_{Q_{k}}[u-f(v)]f_{k-1}(v) \cdot \varepsilon ^{2} \\ &=\int^{x}_{-\infin}\int^{+\infin}_{-\infin} f_{Q_{k}}[u-f(v)]f_{k-1}(v)dvdu \end{aligned} \tag{17}$

所以，有
$f^{-}_{k}(x)=\frac{dP(X_{k}<x)}{dx}=\int^{+\infin}_{-\infin}f_{Q_{k}}[x-f(v)]\cdot f_{k-1}(v)dv \tag{18}$

更新步推导

根据传感器在 $k$ 时刻的观测值 $Y_{k}=y_{k}$ ，更新先验概率 $f^{-}_{k}(x)$ 到后验概率 $f^{+}_{k}(x)$ ，也可以写为 $f_{k}(x|y_{k})$ ，下面进行更新步的推导，

$\begin{aligned} f_{Y_{k}|X_{k}}(y_{k}|x)&=\lim \limits_{\varepsilon \to 0}\frac{P(y_{k}<Y_{k}<y_{k}+\varepsilon|X_{k}=x_{k})}{\varepsilon} \\ &=\lim \limits_{\varepsilon \to 0}\frac{P(y_{k}-h(x_k)<Y_{k}-h(x_k)<y_{k}-h(x_k)+\varepsilon|X_{k}=x_{k})}{\varepsilon} \\ &=\lim \limits_{\varepsilon \to 0}\frac{P(y_{k}-h(x_k)<R_{k}<y_{k}-h(x_k)+\varepsilon|X_{k}=x_{k})}{\varepsilon} \\ &=\lim \limits_{\varepsilon \to 0}\frac{P(y_{k}-h(x_k)<R_{k}<y_{k}-h(x_k)+\varepsilon)}{\varepsilon} \\ &=f_{R_k}[y_k-h(x)] \end{aligned} \tag{19}$

上式中，第三步到第四步是因为 $R_k$ 和 $X_k$ 相互独立，因此，有

$\begin{aligned} f^{+}_{k}(x)&=f_{k}(x|y_k)=\frac{f_{Y_k|X_k}(y_k|x_k)\cdot f^{-}_{k}(x)}{f_{Y_k}(y_k)} \\ &=\frac{f_{R_k}[y_k-h(x)]\cdot f^{-}_{k}(x)}{f_{Y_k}(y_k)} \\ &=\eta \cdot f_{R_k}[y_k-h(x)]\cdot f^{-}_{k}(x) \end{aligned} \tag{20}$

式中，
$\eta= \begin{Bmatrix} \int^{+\infin}_{-\infin}f_{R_{k}}[y_{k}-h(x)]\cdot f^{-}_{k-1}(x)dx \end{Bmatrix} ^{-1}$

经过更新步后，状态量的方差降低了很多，提高了状态估计的准确度。

8.贝叶斯滤波递推过程

$\begin{aligned} f_0(x)&\xRightarrow{预测}f^{-}_{1}(x)=\int^{+\infin}_{-\infin}f_{Q_{1}}[x-f(v)]\cdot f_{0}(v)dv\xRightarrow{观测}f^{+}_{1}(x)=\eta_{1} \cdot f_{R_1}[y_1-h(x)]\cdot f^{-}_{1}(x) \\ &\xRightarrow{预测}f^{-}_{2}(x)=\int^{+\infin}_{-\infin}f_{Q_{2}}[x-f(v)]\cdot f^{+}_{1}(v)dv\xRightarrow{观测}f^{+}_{2}(x)=\eta_{2} \cdot f_{R_2}[y_2-h(x)]\cdot f^{-}_{2}(x) \\ &\ldots \\ &\xRightarrow{预测}f^{-}_{k}(x)=\int^{+\infin}_{-\infin}f_{Q_{k}}[x-f(v)]\cdot f^{+}_{k-1}(v)dv\xRightarrow{观测}f^{+}_{k}(x)=\eta_{k} \cdot f_{R_k}[y_k-h(x)]\cdot f^{-}_{k }(x) \end{aligned}$

其中，
$\eta_{k}= \begin{Bmatrix} \int^{+\infin}_{-\infin}f_{R_{k}}[y_{k}-h(x)]\cdot f^{-}_{k-1}(x)dx \end{Bmatrix} ^{-1}$

公式中，除了初值 $f_0(x)$ 可以认为是先验，也可以认为是后验，其实的每个值 $f_k(x)$ 都需要经过先验和后验两个步骤。

这里递推的都是概率密度函数，想求各个时刻的状态估计，只需要求均值即可。
$\hat{x}_{k}=\int_{-\infin}^{+\infin}x \cdot f_{k}^{+}(x)dx \tag{21}$

这里总结下，贝叶斯滤波算法的流程:

设定初始状态 $x_0$ 和其概率密度 $f_0(x)$ ；
计算下一时刻的先验值： $f^{-}_{k}(x)=\int^{+\infin}_{-\infin}f_{Q_{k}}[x-f(v)]\cdot f_{k-1}^{+}(v)dv$ ；
计算后验值： $f^{+}_{k}(x)=\eta_{k} \cdot f_{R_k}[y_k-h(x)]\cdot f^{-}_{k}(x)$ ；
求当前的状态量： $\hat{x}_{k}=\int_{-\infin}^{+\infin}x \cdot f_{k}^{+}(x)dx$ 。