内容源自<视觉slam十四讲>
最大后验和最大似然
状态估计转换为P(x|z)公式,然后根据贝叶斯法则,删去无关的,再把P(x)干脆也省略了,最后相当于求解arg max P(z|x),也就是最大似然.整个过程把求解最大后验概率转化为最大似然了.
回顾一下经典 SLAM 模型。它由一个运动方程和一个观测方程构成,如下所示:
xk乃是相机的位姿。我们可以使用变换矩阵或李代数表示它。至于观测方程即针孔相机模型。(对于视觉slam)
在噪声的影响下,我们希望通过带噪声的数据 z 和 u,推断位姿 x 和地图 y(以及它们的概率分布),这构成了一个状态估计问题。由于在 SLAM 过程中,这些数据是随着时间逐渐到来的,所以在历史上很长一段时间内,研究者们使用滤波器,尤其是扩展卡尔曼滤波器(EKF)求解它。卡尔曼滤波器关心当前时刻的状态估计 x k ,而对之前的状态则不多考虑;相对的,近年来普遍使用的非线性优化方法,使用所有时刻采集到的数据进行状态估计,并被认为优于传统的滤波器,成为当前视觉 SLAM 的主流方法。
在非线性优化中,我们把所有待估计的变量放在一个“状态变量”中:
<