转载至:https://www.jianshu.com/p/f1d3906e4a3e
最大似然估计是利用已知的样本的结果,在使用某个模型的基础上,反推最有可能导致这样结果的模型参数值。
例子1:抽球
举个通俗的例子:假设一个袋子装有白球与红球,比例未知,现在抽取10次(每次抽完都放回,保证事件独立性),假设抽到了7次白球和3次红球,在此数据样本条件下,可以采用最大似然估计法求解袋子中白球的比例(最大似然估计是一种“模型已定,参数未知”的方法)。当然,这种数据情况下很明显,白球的比例是70%,但如何通过理论的方法得到这个答案呢?一些复杂的条件下,是很难通过直观的方式获得答案的,这时候理论分析就尤为重要了,这也是学者们为何要提出最大似然估计的原因。我们可以定义从袋子中抽取白球和红球的概率如下:
![](http://upload-images.jianshu.io/upload_images/3728828-ec913f4289854429.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/429)
其中theta是未知的,因此,我们定义似然L为:
![](http://upload-images.jianshu.io/upload_images/3728828-bf2e1dd58e5237ca.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/522)
两边取ln,取ln是为了将右边的乘号变为加号,方便求导。
![](http://upload-images.jianshu.io/upload_images/3728828-020a0a025a0bb844.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/606)
![](http://upload-images.jianshu.io/upload_images/3728828-d8ee0f466fb7a734.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/260)
最大似然估计的过程,就是找一个合适的theta,使得平均对数似然的值为最大。因此,可以得到以下公式:
这里讨论的是2次采样的情况,当然也可以拓展到多次采样的情况:
![](http://upload-images.jianshu.io/upload_images/3728828-77df3d49053f6336.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/329)
![](http://upload-images.jianshu.io/upload_images/3728828-4591da9849b6dcde.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/407)
我们定义M为模型(也就是之前公式中的f),表示抽到白球的概率为theta,而抽到红球的概率为(1-theta),因此10次抽取抽到白球7次的概率可以表示为:
将其描述为平均似然可得:
![](http://upload-images.jianshu.io/upload_images/3728828-6bff1817d919eee3.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/700)
![](http://upload-images.jianshu.io/upload_images/3728828-3322f78314093a5a.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/606)
那么最大似然就是找到一个合适的theta,获得最大的平均似然。因此我们可以对平均似然的公式对theta求导,并另导数为0。
![](http://upload-images.jianshu.io/upload_images/3728828-022090faf75834c2.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/597)
由此可得,当抽取白球的概率为0.7时,最可能产生10次抽取抽到白球7次的事件。
例子2:正态分布
假如有一组采样值(x1,...,xn),我们知道其服从正态分布,且标准差已知。当这个正态分布的期望为多少时,产生这个采样数据的概率为最大?
这个例子中正态分布就是模型M,而期望就是前文提到的theta。
![](http://upload-images.jianshu.io/upload_images/3728828-d18925f6fb457102.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/597)
![](http://upload-images.jianshu.io/upload_images/3728828-6db503a50ca2a6e8.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/602)
![](http://upload-images.jianshu.io/upload_images/3728828-ef8d40955ecb7af6.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/700)
![](http://upload-images.jianshu.io/upload_images/3728828-a1fc8f7ba6eee888.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/524)
综上所述,可得求解最大似然估计的一般过程为:
1. 写出似然函数;
2. 如果无法直接求导的话,对似然函数取对数;
3. 求导数 ;
4. 求解模型中参数的最优值。
作者:Dawnli
链接:https://www.jianshu.com/p/f1d3906e4a3e
來源:简书
简书著作权归作者所有,任何形式的转载都请联系作者获得授权并注明出处。