MLE vs. MAP

极大似然估计(Maximum Likelihood Estimate,MLE)

思想精髓:存在的即是最合理的。在假设数据{X,Y}服从分布P(X,Y|\Theta),寻找最能解释数据集的参数,从而使得分布能够最好地刻画数据集.

一般流程:

step -1. 假设数据集的分布为P(X,Y|\Theta),其中\Theta表示确定的参数;

step -2. 求解如下的优化问题:

最大后验估计(Maximum A Posteriori,MAP)

思想精髓:分布P(X,Y|\Theta)中设计的模型参数\Theta本身也服从一个分布P(\Theta),该分布一般来源于在实际生活中,人们所积累的对于类似的事件的一些认知,因此,可以有效地将人对于事物的认知进行编码,尽管有时候这种认知可能与真实的情况有所偏差。

一般流程:

step - 1:假设数据集的分布为P(X,Y|\Theta),其中\Theta表示模型中涉及到的参数;

step - 2:根据过往经验、认知,给出参数\Theta可能服从的先验分布P(\Theta);

step - 3:  结合数据集{X,Y},以及过往经验P(\Theta),求解:

MLE vs. MAP

  • 首先,从上述的叙述中,我们不难发现,MLE在求解的时候,完全相信数据,不加入人的先验认知,认为需要求解的模型参数\Theta就是一个确定的参数;MAP则不然,它认为\Theta本身服从某个分布,而且这个可以将人对该事物的认知嵌入、编码到参数所服从的假设分布中,然后再结合似然函数、先验分布来选择出现概率最大的参数\Theta
  • 其次,在小样本情形下,MAP由于借助先验信息,往往可以得到更加合乎情理的解;MLE则仅仅依靠数据,有可能会得到一些看似不符合我们常识的解。eg:抛一枚硬币3次,发现都是正面,MLE的结果是硬币出现正面的概率等于1。在大样本的情形下,二者的差异往往微乎其微。(读者可以思考一下其中的原因……)
  • 最后,从本质上来看,MLE其实可以看做一种特殊的MAP,即在MAP框架中,如果参数的先验为均匀分布时,MAP框架退化为MLE框架。

抛硬币实例

在抛硬币的游戏中,假定抛一枚硬币N次,其中出现正面n1次,出现反面n0次。基于以上的观察数据,估计硬币正面朝上的概率。

MLE框架的求解流程

分析:由于抛一次硬币只会出现正面或反面两种情况,因此相当于进行一次伯努利实验。假设出现正面的概率为 ,则伯努利实验的结果服从如下的伯努利分布:

                                                                      

抛N次硬币相当于进行N重伯努利实验,出现正面的次数n服从二项分布B(N,\Theta)。特别地,对于观测数据而言,相应的似然函数为:

                                                               

求解可得:\theta ^*=n1/N,即观测数据中出现正面的次数在总观测次数中的占比。这个解在小样本的观测集中可能会不符合我们的常识。eg:抛一枚硬币3次,发现都是正面,MLE的结果是硬币出现正面的概率等于1。

MAP框架的求解流程

假设出现正面的概率为,其中参数\theta服从Beta分布,即:

                                                     

下图为Beta(x|\alpha,\beta)在不同参数(\alpha,\beta)下的概率分布图:

            

这里之所以选择\theta的先验分布为Beta分布,是因为Beta分布和二项分布互为共轭分布,这样可以使得得到的后验分布与先验分布具有相同的形式。基于似然函数与先验分布,我们可以得到\theta的后验分布为:

                                                        

取对数可得:

                                                 

求解得.对比MLE与MAP的解,可以看到MAP的解包含了先验的信息在里面;其实换个角度,也可以将先验理解为一系列的“虚拟”实验,加入先验信息,意味着往观测数据集中加入“虚拟”数据。

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ReLuJie

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值