【简述与推导】似然函数，最大似然估计，条件概率，全概率，贝叶斯概率

最新推荐文章于 2024-01-09 01:18:36 发布

一江明澈的水

最新推荐文章于 2024-01-09 01:18:36 发布

阅读量2k

点赞数 2

分类专栏：概率机器学习深度学习文章标签：似然全概率贝叶斯

本文链接：https://blog.csdn.net/meccaendless/article/details/103242838

版权

似然从字面很难理解什么意思，这里借助了知乎https://www.zhihu.com/question/54082000和quora上的一个回答 What is the difference between probability and likelihood?的回答。不仅回答了似然是什么还指出了似然和概率的区别。

这里作简短概括：

似然和概率同宗同源，像一个双胞胎一样，所以很容易搞混：

链接中给了一个不错的比喻，将概率密度函数和似然函数之间的关系，类比成 幂函数和 指数函数之间的关系。假设一个函数为，这个函数包含两个变量，a，b。如果你令b=2，这样你就得到了一个关于a的二次幂函数，即。当你令a=2时，你将得到一个关于b的指数函数，即。

如此似然和概率他们俩又性格各异（互逆）：

1.1 似然是知道事件结果推参数。举个栗子：如历史上，美国数学家Feller为了得知抛硬币正反的概率参数，一口气抛了10000次硬币，得到结果是4972次正面和5021次反面（事件结果），由此可得到一个硬币正反的概率参数的简单结果：正面概率约0.497,反面约为0.502。

.1.2 概率是知道参数推事件结果。举个栗子：小明知道了Feller大神的实验结果（概率参数），想要算一下抛硬币连续两次正再连续两次反面额概率，那么就是0.497*0.497*0.502*0.502 概率约为0.062（事件结果）。

那么最大似然估计又是什么呢：

回到上面的1.1例子中。令Feller的抛硬币实验次数为N次，其中事件结果是m次为正面，n次为反面（这里有N=m+n）：

那么得到了该次抛硬币实验的似然函数：

$L(\theta|x)=\theta ^{m}*(1-\theta )^{n}$ （式1.1）

其中x代表这次抛硬币N次的事件的已知结果， $\theta$ 为正面朝上的概率参数。求这个似然函数得最大值就是最大似然估计，它代表了有怎样的参数才最有可能复现这次已知事件。Feller抛硬币次数太多，不便于计算，我们取其中10次抛硬币结果：

x=HHTTHTHHHH，这是一个正反序列，套用（式1.1），可得 $L(\theta|x)=\theta ^{7}*(1-\theta )^{3}$ ，这是一个一元多次幂函数，绘制如图1.1函数图：<

关注