似然函数(likehood)和概率分布(probability)

似然函数L(θ|x)

  • 从函数的角度,当变量x已知时,以θ为变量的函数;
  • 从统计的角度,在某一分布下,概率空间中的事件x已知(如抛硬币,x即硬币的正、反面),似然函数为参数θ取什么值时,似然函数L(θ|x)与事件x的结果最接近(最大似然估计)。

似然函数可以简单理解为,在事件发生情况后,利用一个与变量θ有关函数对该现象进行描述的函数,而最大似然估计是求参数θ使得函数所得结果与发生事件的情况最相似。

 

---------------------------------------------------------------------------------------------------------------

扩展阅读

 

这个是quora上的一个回答 What is the difference between probability and likelihood?

有一个硬币,它有θ的概率会正面向上,有1-θ的概率反面向上。θ是存在的,但是你不知道它是多少。为了获得θ的值,你做了一个实验:将硬币抛10次,得到了一个正反序列:x=HHTTHTHHHH。

无论θ的值是多少,这个序列的概率值为 θ⋅θ⋅(1-θ)⋅(1-θ)⋅θ⋅(1-θ)⋅θ⋅θ⋅θ⋅θ = θ⁷ (1-θ)³

比如,如果θ值为0,则得到这个序列的概率值为0。如果θ值为1/2,概率值为1/1024。

但是,我们应该得到一个更大的概率值,所以我们尝试了所有θ可取的值,画出了下图:

这个曲线就是θ的似然函数,通过了解在某一假设下,已知数据发生的可能性,来评价哪一个假设更接近θ的真实值。

如图所示,最有可能的假设是在θ=0.7的时候取到。但是,你无须得出最终的结论θ=0.7。事实上,根据贝叶斯法则,0.7是一个不太可能的取值(如果你知道几乎所有的硬币都是均质的,那么这个实验并没有提供足够的证据来说服它是均质的)。但是,0.7却是最大似然估计的取值。

因为这里仅仅试验了一次,得到的样本太少,所以最终求出的最大似然值偏差较大,如果经过多次试验,扩充样本空间,则最终求得的最大似然估计将接近真实值0.5。在这篇博客中有详细的过程,就不再赘述。

 

作者:HiTao
链接:https://www.zhihu.com/question/54082000/answer/470252492
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

---------------------------------------------------------------------------------------------------------------

【个人觉得下面这个写的最简单,精炼,也最容易理解!!!】

L(θ|x)=f(x|θ)
这个等式表示的是对于事件发生的两种角度的看法。等式两边都是表示的这个事件发生的概率或者说可能性。在给定一个样本x后,我们去想这个样本出现的可能性到底是多大。

统计学的观点始终是认为样本的出现是基于一个分布的。那么我们去假设这个分布为f,里面有参数theta。对于不同的theta,样本的分布不一样。f(x|θ)表示的就是在给定参数theta的情况下,x出现的可能性多大。L(θ|x)表示的是在给定样本x的时候,哪个参数theta使得x出现的可能性多大。所以其实这个等式要表示的核心意思都是在给一个theta和一个样本x的时候,整个事件发生的可能性多大。

作者:冯龙
链接:https://www.zhihu.com/question/54082000/answer/138115757
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值