https://www.zhihu.com/question/23971601
https://www.zhihu.com/question/23971601/answer/46480923
怒答!刚刚学过并且试着直观地理解过,如有不妥的地方还望大牛们指教。图片来源及参考文献:https://courses.engr.illinois.edu/ece420/sp2017/UnderstandingKalmanFilter.pdf(如果上面的链接失效,贴一个备用IEEE Xplore的链接,大家自行下载:Understanding the Basis of the Kalman Filter Via a Simple and Intuitive Derivation [Lecture Notes])
题主如果只是想泛泛理解, Kent Zeng 的回答已经非常棒了。我尝试做一个更详细的解答。请看下图:t=0时小车的位置服从红色的正态分布。
根据小车的这个位置,我们可以预测出t=1时刻它的位置:分布变“胖”了,这很好理解——因为在递推的过程中又加了一层噪声,所以不确定度变大了。为了避免纯估计带来的偏差,我们在t=1时刻对小车的位置坐标进行一次雷达测量,当然雷达对小车距离的测量也会受到种种因素的影响,于是测量结果告诉我们,小车t=1时的位置服从蓝色分布:
好了,现在我们得到两个不同的结果。前面有人提过加权,Kalman老先生的牛逼之处就在于找到了相应权值,使红蓝分布合并为下图这个绿色的正态分布(啰嗦一句,这个绿色分布均值位置在红蓝均值间的比例称为Kalman增益(比如下图中近似0.8),就是各种公式里的K(t))
你问为什么牛逼?绿色分布不仅保证了在红蓝给定的条件下,小车位于该点的概率最大,而且,而且,它居然还是一个正态分布!正态分布就意味着,可以把它当做初值继续往下算了!这是Kalman滤波能够迭代的关键。最后,把绿色分布当做第一张图中的红色分布对t=2时刻进行预测,算法就可以开始循环往复了。你又要问了,说来说去绿色分布是怎么得出的呢?其实可以通过多种方式推导出来。我们课上讲过的就有最大似然法、Ricatti方程法,以及上面参考文献中提及的直接对高斯密度函数变形的方法,这个不展开说了。另外,由于我只对小车位移这个一维量做了估计,因此Kalman增益是标量,通常情况下它都是一个矩阵。而且如果估计多维量,还应该引入协方差矩阵的迭代,我也没有提到。如果楼主有兴趣,把我提及那篇参考文献吃透,就明白了。Kalman滤波算法的本质就是利用两个正态分布的融合仍是正态分布这一特性进行迭代而已。