极大似然估计与极大后验估计

最新推荐文章于 2023-09-24 13:37:46 发布

小妖精Fsky

最新推荐文章于 2023-09-24 13:37:46 发布

阅读量540

点赞数 1

分类专栏： Machine Learning 文章标签：似然估计

本文链接：https://blog.csdn.net/appleml/article/details/81395789

版权

Machine Learning 专栏收录该内容

61 篇文章 0 订阅

订阅专栏

这两个概念一直说混混沌沌，在看决策树的时候出现了极大似然估计，于是趁此机会也彻底分清楚两个概念，我们从根源开始说起：
概率（probabilty）:
概率研究的问题是，已知一个模型和参数，怎么去预测这个模型产生的结果的特性（例如均值，方差，协方差等等）。举个例子，我想研究怎么养猪（模型是猪），我选好了想养的品种、喂养方式、猪棚的设计等等（选择参数），我想知道我养出来的猪大概能有多肥，肉质怎么样（预测结果）。
统计（statistics）:
统计研究的问题则相反。统计是，有一堆数据，要利用这堆数据去预测模型和参数。仍以猪为例。现在我买到了一堆肉，通过观察和判断，我确定这是猪肉（这就确定了模型。在实际研究中，也是通过观察数据推测模型是／像高斯分布的、指数分布的、拉普拉斯分布的等等），然后，可以进一步研究，判定这猪的品种、这是圈养猪还是跑山猪还是网易猪，等等（推测模型参数）。
一句话总结：概率是已知模型和参数，推数据。统计是已知数据，推模型和参数。显然，本文解释的MLE和MAP都是统计领域的问题。它们都是用来推测参数的方法。

极大似然估计：通俗理解来说，就是在假定整体模型分布已知，利用已知的样本结果信息，反推最具有可能（最大概率）导致这些样本结果出现的模型参数值！换句话说，极大似然估计提供了一种给定观察数据来评估模型参数的方法，即：“模型已定，参数未知”。
例子（概念和公式比较枯燥，跟例子绑定，看到似然估计就想到黑白球）:
由抽到的球的颜色推测罐子中黑白球的比例
假如有一个罐子，里面有黑白两种颜色的球，数目多少不知，两种颜色的比例也不知。我们想知道罐中白球和黑球的比例，但我们不能把罐中的球全部拿出来数。
现在我们可以每次任意从已经摇匀的罐中拿一个球出来，记录球的颜色，然后把拿出来的球再放回罐中。这个过程可以重复，我们可以用记录的球的颜色来估计罐中黑白球的比例。假如在前面的一百次重复记录中，有七十次是白球，请问罐中白球所占的比例最有可能是多少？
很多人马上就有答案了：70%。而其后的理论支撑是什么呢？
我们假设罐中白球的比例是p，那么黑球的比例就是1-p。因为每抽一个球出来，在记录颜色之后，我们把抽出的球放回了罐中并摇匀，所以每次抽出来的球的颜色服从同一独立分布。
这里我们把一次抽出来球的颜色称为一次抽样。题目中在一百次抽样中，七十次是白球的,三十次为黑球事件的概率是P(样本结果|Model)。
如果第一次抽象的结果记为x1,第二次抽样的结果记为x2….那么样本结果为(x1,x2…..,x100)。这样，我们可以得到如下表达式：
P(样本结果|Model)
= P(x1,x2,…,x100|Model)
= P(x1|Mel)P(x2|M)…P(x100|M)
= p^70(1-p)^30.

好的，我们已经有了观察样本结果出现的概率表达式了。那么我们要求的模型的参数，也就是求的式中的p。那么我们怎么来求这个p呢？按照什么标准来求这个p呢？不同的p，直接导致P（样本结果|Model）的不同。

好的，我们的p实际上是有无数多种分布的。如下：

P(白球的比例)	1-p(黑球的比例)
50%	50%

那么在上面p的分布条件下得：
p $^{70}$ * (1-p) $^{30}$ = 0.5 $^{70}$ * (1-0.5) $^{30}$ = 7.8 * 10 $^{(-31)}$

p的分布也可以是如下：

P(白球的比例)	1-p(黑球的比例)
70%	30%

可以得： p $^{70}$ * (1-p) $^{30}$ = 0.7 $^{70}$ * (1-0.7) $^{30}$ = 2.95 * 10 $^{(-27)}$

那么问题来了，既然有无数种分布可以选择，极大似然估计应该按照什么原则去选取这个分布呢？
答：采取的方法是让这个样本结果出现的可能性最大，也就是使得 p $^{70}$ * (1-p) $^{30}$ 值最大，那么我们就可以看成是p的方程，求导即可！
那么既然事情已经发生了，为什么不让这个出现的结果的可能性最大呢？使得发生的样本出现的可能性最大。这就是最大似然估计的核心。
我们想办法让观察样本出现的概率最大，转换为数学问题就是使得：
p $^{70}$ * (1-p) $^{30}$ 最大，这太简单了，未知数只有一个p，我们令其导数为0，即可求出p为70%，与我们一开始认为的70%是一致的。其中蕴含着我们的数学思想在里面。
数学原理：

线性回归模型使用的误差函数（也叫代价函数）采用的是平方和，为什么不是四次方和或者是绝对值和呢？这里便是通过极大似然估计法来确定的。
不同点：

参考文献：
https://www.cnblogs.com/sylvanas2012/p/5058065.html
https://blog.csdn.net/u011508640/article/details/72815981
http://www.sohu.com/a/208191273_697750

小妖精Fsky

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
极大似然估计与极大后验估计

这两个概念一直说混混沌沌，在看决策树的时候出现了极大似然估计，于是趁此机会也彻底分清楚两个概念，我们从根源开始说起：参考文献： https://www.cnblogs.com/sylvanas2012/p/5058065.html...
复制链接

扫一扫