摘要
我们经常使用的卡尔曼滤波、图优化属于生成模型。生成模型不适合处理带有丰富特性的图像数据。
判别模型可以处理图像数据,但是通常来说比较难训练。比如从图像直接训练出位置信息是比较难的。现在的state-of-the-art也才达到2m的精度。
本文是把生成模型与判别模型的优势结合在一起。
一,相关工作
一个生成模型的例子如下:
以上的例子中,如果观测z是图像,明显就不行了。但是也有例外,SLAM中的直接法就是一种类似的建模,有个假设就是两帧之间间隔很小,直接法就是一个复杂的观测模型。
模型部分
最终要估计的变量是位置X, 直接从图像或者激光雷达中估计位置是一件比较困难的事情,但是如果从原始观测中估计一个速度v,则是一件相对容易的任务。
o
o
o表示激光数据,
z
z
z表示从激光获取的速度观测,
x
x
x表示车的位置。深度学习部分,将
o
o
o–>
z
z
z. 滤波部分,将
z
z
z作为一个观测,变量是
x
x
x。
通过卡尔曼滤波,以z为输入,最终估计出x,然后和真值位置进行比较,即可定义loss function
训练的过程就是利用后向传播进行求偏导的过程。