极大似然估计(MLE)相关总结

一、极大似然估计概述

        极大似然估计是频率学派的进行参数估计的法宝,基于以下两种假设前提:
①某一事件发生是因为该事件发生概率最大。
②事件发生与模型参数θ有关,模型参数θ是一个定值。
        极大似然估计是通过已知样本数据,来推导出最大概率出现这个事实的模型参数值,并将这一参数值作为估计的真实值。
        举例:抛硬币10次,若出现一次结果为5次正面朝上,5次反面朝上。设出现这一结果与P有关,则似然函数为L(P)=p^5*(1-p)^5,对其取对数求导,令导数为零,求得p为0.5。则我们有理由认为当p等于0.5时,最有可能出现抛硬币10次,其中5次正面朝上,5次反面朝上这样的结果。

二、极大似然原理及思想

        极大似然原理的直观想法是:一个随机试验如有若干个可能的结果A,B,C,…。若在一次试验中,结果A出现,则一般认为试验条件对A出现有利,也即A出现的概率很大。
        极大似然原理:若事件A发生的概率与参数 θ有关,θ取值不同则 P(A)也不同。记事件A发生的概率为 P(A|θ). 若一次试验事件中,A发生了,可认为此时的 θ值是在其定义域内,使得P(A|θ) 达到最大的那一个。
        极大似然估计是建立在极大似然原理基础上的一个统计方法。它是一种参数估计,在样本满足独立同分布情况下,通过已知的样本数据,来推导最大概率出现这个事实的模型参数值,若已知某个参数能使得这个样本出现的概率最大,就将这一参数值作为估计的真实值。即模型已知,参数未知,通过已知模型推导出参数最可能的值。

三、似然函数与概率密度函数:L(θ|x)= f(x|θ)

似然函数:L(θ|x)

概率密度函数: f(x|θ)

在给定一个样本X后,在不同θ下,推测这个样本出现的可能性多大

在给定参数θ情况下,样本X出现的可能性多大

        似然函数与概率密度函数在概念上不等,但在数值上相等。等式核心意思是:在给定一个θ和一个样本X时,整个事件发生的可能性多大。

四、极大似然估计的求解

        假设总体分布族为{p(x;θ):θ ∈ 参数空间},其中p(x;θ)为概率分布列或密度函数为f(x;θ)。x1,x2,…,xn是简单样本,则样本的联合概率分布为:
        ① 离散型随机变量:

        ② 连续型随机变量:

                当样本x1,x2,…,xn给定时,p(x1,x2,…,xn;θ)是参数θ的函数,称这个函数为似然函数,记为L(θ;x1,x2,…,xn),或L(θ;x),或L(θ),即

        具体求解步骤:
        (1)构造似然函数 L(θ) :

                 总体X为离散型
                 总体X为连续型:

        (2)取对数: lnL(θ) :
             总体X为离散型:
             总体X为连续型:    ;

        (3)对Ln L(θ)求偏导等于0;

        (4)解似然方程得到 θ 的极大似然估计值 θ^ 。

五、极大似然估计的优点与缺点

优点缺点

①不变性
②相合性
③渐进正态性
④渐进有效性
⑤充分统计量函数
其中②③④为在一定正则条件下或者说很一般条件下极大似然估计拥有的优点

①前提是分布已知,要求较高
②不一定无偏
③不一定相合
④不一定渐进正态
⑤不一定存在
⑥不一定唯一
⑦计算有时很复杂,需用迭代法
⑧从统计决策理论来看,MLE未考虑损失函数

六、其他参数估计方法

        矩估计:
                以样本矩估计总体中相应的参数,以样本矩的函数估计总体矩的函数。
        最小二乘估计(LSE):
                通过最小化误差的平方和寻找数据的最佳函数匹配。具体为:找一个(组)估计值,使          得实际值与估计值之差的平方加总之后的值最小。这时,将这个差的平方的和式对参数求导            数,并取一阶导数为零,就是LSE。        
        贝叶斯估计:
                贝叶斯估计是包含先验假设的极大似然估计,是对极大似然估计的一种改进。认为待估           参数θ也是随机的,我们可以根据先验信息建立一个θ服从的分布,合理利用先验信息进行统           计判断。

七、极大似然估计(MLE)与最大后验估计(MAP)

MLEMAP
极大似然估计是频率学派常用参数估计方法,认为事件本身就具有客观的不确定性,直接为事件本身建模,也就是说事件在多次重复实验中趋于一个稳定的值p,那么这个值就是该事件的概率。

贝叶斯学派不去试图解释 事件本身的随机性,而是从观察者角度出发,认为不确定性来源于观察者的知识不完备,在这种情况下,通过已经观察到的信息来描述最有可能推导的过程。

模型参数是个定值

模型参数源于某种潜在分布

MLE是求参数θ的值,使得似然函数P(x|θ)最大。

MAP希望θ不仅使似然函数最大,同时也希望θ本身出现的先验概率也最大。

                极大似然估计与最大后验概率估计的区别在于对先验信息的了解程度,如果忽略模型参           数本身的概率的分布,或者认为参数服从0-1均匀分布,那么最大后验概率估计将弱化为最大         似然估计。

八、关于极大似然估计的总结

        极大似然估计是生产生活中一种常用的参数估计方法,它是根据已出现的样本结果,来推测导致该结果出现概率最大的模型参数θ。例如:在二分类机器学习模型logistic回归中,可以通过MLE估计模型参数,再使用其他方法进行参数优化。MLE是一种较为简单的估计,当样本数目增加时,收敛性很好,如果在假设的概率模型正确,通常能获得较好的结果。

参考

  • 9
    点赞
  • 57
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
极大似然估计(Maximum Likelihood Estimation,简称MLE)是统计学中一种参数估计方法,指寻找最有可能(最大概率)解释已观察到的数据的参数值。USTC是中国科学技术大学的简称。 在USTC中,极大似然估计是统计学和概率论中的基础概念和方法之一。它被广泛应用于各个学科的研究和实践中,特别是与数据分析、模型拟合、测试假设等相关的领域。 极大似然估计的基本思想是,根据已观察到的数据,通过估计参数的取值,使得生成这些数据的概率最大化。通常需要假设数据服从某个概率分布,并且已有的观测数据是独立同分布的。 在实际应用中,极大似然估计方法有很多具体的步骤和技巧。一般来说,首先需要建立概率模型,并假设参数的取值空间。然后,利用已观测到的数据,计算参数取值下数据发生的概率,即似然函数。接下来,通过对似然函数进行最大化的优化,得到估计的参数值。最后,通过对参数的估计值进行验证和推断,对模型的有效性和可靠性进行评估。 USTC作为一所综合性、研究型、世界一流的大学,极大似然估计作为统计学中的重要概念和方法,也在该校的相关学科教学和研究中得到广泛应用。通过学习和掌握极大似然估计,USTC的学生能够在未来的研究、数据分析和决策过程中,更好地处理和利用观测到的数据,提高模型的精确性和可靠性。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值