通俗理解极大似然估计

维基百科:在统计学中,最大似然估计(英语:Maximum Likelihood Estimation,简作MLE),也称极大似然估计,是用来估计一个概率模型的参数的一种方法

极大似然估计,通俗理解来说,就是利用已知的样本结果信息,反推最具有可能(最大概率)导致这些样本结果出现的模型参数值!

换句话说,极大似然估计提供了一种给定观察数据来评估模型参数的方法,即:“模型已定,参数未知”。

        某件事已经发生了,我们知道这件事的概率模型,但是不知道具体的参数,我们需要找到使这件事发生概率最大对应的模型参数。      

原理:

       给定一个概率分布{\displaystyle D}已知其概率密度函数(连续分布)或概率质量函数(离散分布){\displaystyle f_{D}},以及一个分布参数{\displaystyle \theta },我们可以从这个分布中抽出一个具有个值的采样{\displaystyle X_{1},X_{2},\ldots ,X_{n}},利用{\displaystyle f_{D}}计算出其似然函数

                                       {\displaystyle {\mbox{L}}(\theta \mid x_{1},\dots ,x_{n})=f_{\theta }(x_{1},\dots ,x_{n}).}

          若{\displaystyle D}是离散分布,{\displaystyle f_{\theta }}即是在参数为{\displaystyle \theta }时观测到这一采样的概率。若其是连续分布,{\displaystyle f_{\theta }}则为{\displaystyle X_{1},X_{2},\ldots ,X_{n}}联合分布的概率密度函数在观测值处的取值。一旦我们获得{\displaystyle X_{1},X_{2},\ldots ,X_{n}},我们就能求得一个关于{\displaystyle \theta }的估计。最大似然估计会寻找关于{\displaystyle \theta }的最可能的值(即,在所有可能的{\displaystyle \theta }取值中,寻找一个值使这个采样的“可能性”最大化)。从数学上来说,我们可以在{\displaystyle \theta }的所有可能取值中寻找一个值使得似然函数取到最大值,这使可能性最大的{\displaystyle {\widehat {\theta }}}值即称为{\displaystyle \theta }的最大似然估计。由定义,最大似然估计是样本的函数。

      可以这么理解,这一事件的概率密度函数是已知的,我们知道样本(采样点)服从二次函数:ax^{2}+bx+c =0,我们当前知道这个函数上的几个离散点,如(1,2), (2,4), (5,6),(2,5),现在我们要求一个最优的a,b,更加能贴近每个点,目标是使整体的误差最小,极大似然估计的原理和这个相同。

     举例说明(来源维基百科):

        假设一个盒子中有无数个硬币,硬币抛出正面的概率为{\displaystyle p}(硬币不是均匀的,假设对于任何的p,都有这样的硬币存在),{\displaystyle 0\leq p\leq 1},我们把这个硬币抛80次(即,我们获取一个采样{\displaystyle x_{1}={\mbox{H}},x_{2}={\mbox{T}},\ldots ,x_{80}={\mbox{T}}} 并把正面的次数记下来,正面记为H,反面记为T)。因此,这里的{\displaystyle p}即相当于上边的{\displaystyle \theta }。假设我们抛出了49个正面,31个反面,即49次H,31次T。

·      我们来求其似然函数(这件事发生概率)的最大值:

                             {\displaystyle {\begin{matrix}{\mbox{L}}(\theta )&=&f_{D}({\mbox{H=49,T=80-49}}\mid p)={80 \choose 49}p^{49}(1-p)^{31}\\\end{matrix}}}

似然函数可以理解为:我们要用未知参数的模型、事件发生的次数来把这个事件发生的概率表示出来,然后求其最大值对应的参数值

其中{\displaystyle 0\leq p\leq 1}, 我们可以使用微分法来求极值。方程两边同时对{\displaystyle p}微分,并使其为零。

                             {\displaystyle {\begin{matrix}0&=&{80 \choose 49}{\frac {d}{dp}}\left(p^{49}(1-p)^{31}\right)\\&&\\&\propto &49p^{48}(1-p)^{31}-31p^{49}(1-p)^{30}\\&&\\&=&p^{48}(1-p)^{30}\left[49(1-p)-31p\right]\\\end{matrix}}}

其解为{\displaystyle p=0}{\displaystyle p=1},以及{\displaystyle p=49/80}.使可能性最大的解显然是{\displaystyle p=49/80},因为{\displaystyle p=0}{\displaystyle p=1}

都会使L(\theta )=0, 而{\displaystyle p=49/80}能使L(\theta )为最大值,因为函数的最大值在零点处,另外两个零点都不是函数的最大值,那么这个一定是函数的最大值。因此我们说最大似然估计值{\displaystyle {\widehat {p}}=49/80},即这个盒子中硬币正面朝上的概率为{\displaystyle {\widehat {p}}=49/80}

          最大似然估计出来的参数值,只有当实验次数很大时才具有一定的可信度,假如上面的例子实验了1000次,发现正面朝上的次数为501次,反面朝上的概率为499,那么采用最大似然估计出来的正面朝上的概率值{\displaystyle {\widehat {p}}=501/1000} = 0.501, 这个值会更加接近真实的模型参数值。

 

                                 

推荐:极大似然估计详解_知行流浪-CSDN博客_极大似然估计

原文:一文搞懂极大似然估计 - 知乎

最大似然估计 - 维基百科,自由的百科全书 (wikipedia.org)

  • 7
    点赞
  • 56
    收藏
    觉得还不错? 一键收藏
  • 5
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值