何为似然函数？

最新推荐文章于 2022-06-06 11:57:56 发布

weixin_34186931

最新推荐文章于 2022-06-06 11:57:56 发布

阅读量447

点赞数

文章标签： python

原文链接：https://my.oschina.net/lCQ3FC3/blog/845218

版权

2019独角兽企业重金招聘Python工程师标准>>>

#################################解释1

http://zh.wikipedia.org/zh-hans/似然函数

在数理统计学中，似然函数是一种关于统计模型中的参数的函数，表示模型参数中的似然性。似然函数在统计推断中有重大作用，如在最大似然估计和费雪信息之中的应用等等。“似然性”与“或然性”或“概率”意思相近，都是指某种事件发生的可能性，但是在统计学中，“似然性”和“或然性”或“概率”又有明确的区分。概率用于在已知一些参数的情况下，预测接下来的观测所得到的结果，而似然性则是用于在已知某些观测所得到的结果时，对有关事物的性质的参数进行估计。（理解：似然函数是观测样本确定，而关于模型参数的函数。概率可以理解成一个特殊的似然函数，特殊在这个函数或模型的参数已经确定，比如投资硬币，在模型中参数为：硬币正面朝上的可能为0.5）似然函数是根据给定样本，计算模型参数的函数，而在估算参数时，需要选取一定标准和准则，若标准是，计算的参数可以让给定样本出现或发生的概率最大，这就是著名的最大似然估计。

在这种意义上，似然函数可以理解为条件概率的逆反。在已知某个参数B时，事件A会发生的概率写作。

利用贝叶斯定理，

因此，我们可以反过来构造表示似然性的方法：已知有事件A发生，运用似然函数，我们估计参数B的可能性。形式上，似然函数也是一种条件概率函数，但我们关注的变量改变了：

注意到这里并不要求似然函数满足归一性：。一个似然函数乘以一个正的常数之后仍然是似然函数。对所有α > 0，都可以有似然函数：

[编辑]例子

两次投掷都正面朝上时的似然函数

考虑投掷一枚硬币的实验。通常来说，已知投出的硬币正面朝上和反面朝上的概率各自是pH = 0.5，便可以知道投掷若干次后出现各种结果的可能性。比如说，投两次都是正面朝上的概率是0.25。用条件概率表示，就是：

其中H表示正面朝上。

在统计学中，我们关心的是在已知一系列投掷的结果时，关于硬币投掷时正面朝上的可能性的信息。我们可以建立一个统计模型：假设硬币投出时会有pH 的概率正面朝上，而有1 ? pH 的概率反面朝上。这时，条件概率可以改写成似然函数：

也就是说，对于取定的似然函数，在观测到两次投掷都是正面朝上时，pH = 0.5 的似然性是0.25（这并不表示当观测到两次正面朝上时pH = 0.5的概率是0.25）。

如果考虑pH = 0.6，那么似然函数的值也会改变。

三次投掷中头两次正面朝上，第三次反面朝上时的似然函数

注意到似然函数的值变大了。这说明，如果参数pH 的取值变成0.6的话，结果观测到连续两次正面朝上的概率要比假设pH = 0.5 时更大。也就是说，参数pH 取成0.6 要比取成0.5 更有说服力，更为“合理”。总之，似然函数的重要性不是它的具体取值，而是当参数变化时函数到底变小还是变大。对同一个似然函数，如果存在一个参数值，使得它的函数值达到最大的话，那么这个值就是最为“合理”的参数值。

在这个例子中，似然函数实际上等于：

，其中。

如果取pH = 1，那么似然函数达到最大值1。也就是说，当连续观测到两次正面朝上时，假设硬币投掷时正面朝上的概率为1是最合理的。

类似地，如果观测到的是三次投掷硬币，头两次正面朝上，第三次反面朝上，那么似然函数将会是：

，其中T表示反面朝上，。

这时候，似然函数的最大值将会在的时候取到。也就是说，当观测到三次投掷中前两次正面朝上而后一次反面朝上时，估计硬币投掷时正面朝上的概率是最合理的。

[编辑]应用

[编辑]最大似然估计

主条目：最大似然估计

最大似然估计是似然函数最初也是最自然的应用。上文已经提到，似然函数取得最大值表示相应的参数能够使得统计模型最为合理。从这样一个想法出发，最大似然估计的做法是：首先选取似然函数（一般是概率密度函数或概率质量函数），整理之后求最大值。实际应用中一般会取似然函数的对数作为求最大值的函数，这样求出的最大值和直接求最大值得到的结果是相同的。似然函数的最大值不一定唯一，也不一定存在。与矩法估计比较，最大似然估计的精确度较高，信息损失较少，但计算量较大。

############################################# 解释2

给定一个概率分布，假定其概率密度函数（连续分布）或概率聚集函数（离散分布）为，以及一个分布参数，我们可以从这个分布中抽出一个具有个值的采样，通过利用，我们就能计算出其概率：

但是，我们可能不知道的值，尽管我们知道这些采样数据来自于分布。那么我们如何才能估计出呢？一个自然的想法是从这个分布中抽出一个具有个值的采样，然后用这些采样数据来估计.

一旦我们获得，我们就能从中找到一个关于的估计。最大似然估计会寻找关于的最可能的值（即，在所有可能的取值中，寻找一个值使这个采样的“可能性”最大化）。这种方法正好同一些其他的估计方法不同，如的非偏估计，非偏估计未必会输出一个最可能的值，而是会输出一个既不高估也不低估的值。 （除了最大似然估计，还有无偏估计或非偏估计）

要在数学上实现最大似然估计法，我们首先要定义似然函数:

并且在的所有取值上，使这个函数最大化。这个使可能性最大的值即被称为的最大似然估计。

[编辑]注意

这里的似然函数是指不变时，关于的一个函数。
最大似然估计函数不一定是惟一的，甚至不一定存在。

例子

离散分布，离散有限参数空间

考虑一个抛硬币的例子。假设这个硬币正面跟反面轻重不同。我们把这个硬币抛80次（即，我们获取一个采样并把正面的次数记下来，正面记为H，反面记为T）。并把抛出一个正面的概率记为，抛出一个反面的概率记为（因此，这里的即相当于上边的）。假设我们抛出了49个正面，31个反面，即49次H，31次T。假设这个硬币是我们从一个装了三个硬币的盒子里头取出的。这三个硬币抛出正面的概率分别为, , .这些硬币没有标记，所以我们无法知道哪个是哪个。使用最大似然估计，通过这些试验数据（即采样数据），我们可以计算出哪个硬币的可能性最大。这个似然函数取以下三个值中的一个：

我们可以看到当时，似然函数取得最大值。这就是的最大似然估计。