最大似然估计_机器人学的概率方法——最大似然估计MLE与最大后验概率估计MAP...

weixin_39818662

于 2020-12-19 15:59:31 发布

阅读量278

点赞数

文章标签：最大似然估计

本文链接：https://blog.csdn.net/weixin_39818662/article/details/111617449

版权

Probabilistic in Robotics Ⅰ: MLE & MAP

本系列结合 Probabilistic Robotics 以及 Deep Learning 两本书，从 贝叶斯(Bayes)视角学习 推断(inference)。

我们先强化一下情怀：

Wouldn’t it be great if all our cars were able to safely steer themselves, making car accidents a notion of the past? Wouldn’t it be great if robots, and not people, would clean up nuclear disasters sites like Chernobyl? Wouldn’t it be great if our homes were populated by intelligent service robots that would carry out such tedious tasks as loading the dishwasher, and vacuuming the carpet, or walking our dogs? And lastly, a better understanding of robotics will ultimately lead to a better understanding of animals and people.

Why Probabilistic?

因为相比于游戏AI，机器人所面临的 Uncertainty 更多。

Environment：物理世界的环境更不可预测。
Sensors：传感器有精度限制。机器人的激光雷达和摄像头可没有游戏AI的全局视野哦。此外，还容易受到噪音干扰。
Robots：机器人的控制也是有误差的，完全不是你想的那样指哪打哪。
Models：对环境以及机器人本体的动力学、运动学建模也是漏洞百出。在 Model-Based RL 系列 (Ⅰ, Ⅱ, Ⅲ) 我们应该已经深有感触了。
Computation：作为real-time系统，机器人的智能控制系统的计算量就受到了限制。

All of these factors 给机器人系统带来了极大的 uncertainty。概率的方法能够让机器人了解自身的不确定性，从而在应对以上不确定性时更加鲁棒robust。

频率派与贝叶斯派

这是一个绕不过的话题，在进行概率机器人学习之前，我们必须清楚地了解这两种思路在探讨不确定性时，出发点和立足点的差异。

频率派：从事件的角度，试图通过多次独立重复实验，以事件发生的频率逼近事件的概率，以此来描述事件本身的随机性。
贝叶斯派：从观察者的角度，以观察者知识不完备(先验prior belief)为出发点，通过多次独立重复实验(统计证据evidence)，使观察者对事件发生的概率具有完备地了解(后验posterior belief)。因此随机性并不源于事件本身，而是用于描述观察者对事件地知识状态。

另一种解释是：

频率派：其特征是把需要推断的参数 θ 视作固定且未知的常数，而样本 X 是随机的，其着眼点在样本空间，有关的概率计算都是针对X的分布。
贝叶斯派：他们把参数 θ 视作随机变量，而样本 X 是固定的，其着眼点在参数空间，重视参数 θ 的分布，固定的操作模式是通过参数的先验分布结合样本信息得到参数的后验分布。

二者从世界观上具有根本性的差异，但各具优势。贝叶斯派在推断的过程中加入了先验，更符合人或机器解决问题的思路，因此在机器学习中大放异彩。频率派则对不适合引入先验知识、十分追求严谨的应用场景更有优势。而在机器人学、强化学习以及后面可能会讲的因果推理中，我们更倾向于贝叶斯派。

最大似然估计MLE和最大后验概率MAP

两个学派对应了如下两种经典的推断方法：

频率学派（Frequentist）- 最大似然估计（MLE, Maximum Likelihood Estimation）
贝叶斯学派（Bayesians）- 最大后验估计（MAP, Maximum A Posteriori）

什么叫似然？

详解最大似然估计（MLE）、最大后验概率估计（MAP），以及贝叶斯公式的理解

这篇文章写的很好，我就直接抄了。

似然，和“概率”，“可能性”的意思差不多。在统计里面，似然函数和概率函数却是两个不同的概念（其实也很相近就是了）。

对于函数

， x 表示某一个具体的数据；θ 表示模型的参数。

似然函数：如果x是已知确定的，θ 是变量，这个函数叫做似然函数(likelihood function), 它描述对于不同的模型参数，出现x这个样本点的概率是多少。
概率函数：如果 θ 是已知确定的，x 是变量，这个函数叫做概率函数(probability function)，它描述对于不同的样本点x，其出现概率是多少。

我们来看看同一个问题，MLE和MAP怎么求解。

假设有一个造币厂生产某种硬币，现在我们拿到了一枚这种硬币，想试试这硬币是不是均匀的。即想知道抛这枚硬币，正反面出现的概率（记为θ）各是多少？
于是我们拿这枚硬币抛了10次，得到的数据（
）是：反正正正正反正正正反。我们想求的正面概率θ是模型参数，而抛硬币模型我们可以假设是二项分布。

那么，出现实验结果
（即反正正正正反正正正反）的似然函数是多少呢？