怎么理解最大似然估计(Maximum Likelihood Estimation, MLE)

参考资料:

https://www.youtube.com/watch?v=XepXtl9YKwc

https://www.youtube.com/watch?v=66FqSpf1trA

动机(可跳过)

在学习Softmax时,我们知道一个实例被预测的每一类的概率是这样计算的:

P(Y=y_i | X = x_i) = \frac{e^{f(W;x_i)}}{\sum_j e^{f(W;x_j)}}

其中f()函数是线性分类器,通过分类器会计算出每一类的分数(scores),随后通过上述公式将每一类的预测概率转化到(0,1)之间,并且所有预测的概率之和是1

损失函数计算如下:

L(x_i) = - \log(P)

于是,我们的目的是使Loss最小,也就是找到分类器的权重W,能够使得正确分类的概率的负对数最小化,也就是使正确分类的概率最大化,这可以看作使一个最大似然估计(MLE)问题

那么什么是MLE呢?

定义和易懂例子

先说定义,MLE指的是,找到能够使得定义的模型,观测到我们想要观测的事件的概率最大化,的参数

也就是说,我们终极目标使找到合适的模型参数,在此之前我们要明确想要观测的事件,以及选定模型

可以通过两个简单的例子来帮助理解

例子1:抛硬币

事件:抛四次硬币,我们想要观测到事件是: 正,正,反,正

模型:假设正的概率为P,反面的概率是(1-P), 那么得到的概率模型就是 P^3(1-P)

那么我们的目的就是找到P的数值,使得事件发生的概率最大,通过计算得到P=0.75

这就是我们使用最大似然估计找到合适参数的例子。

例子2:观测小鼠体重

假设小鼠体重的分布是如下图片所示

模型:我们看到数据在中部集中,两端分散,很直观的会选择正态分布模型

事件:观测到尽可能多的小鼠体重

正态分布有两个重要参数,均值 μ 和方差 σ ,在这里假设方差固定,我们的目的就是找到合适的 μ ,使观测到尽可能多的小鼠重量的可能性尽可能的大。

每一条红线代表一种正态分布,横轴表示体重,竖轴代表观测到的体重对应的概率。在横坐标上从左到右移动正态分布,就是不断增加 μ

当移动到大概中间位置,我们发现观测到绝大多数的小鼠体重的概率最大,那么我们就找到了最合适的 μ

解决这个问题,就可以看作使用了最大似然(MLE)。

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 最大似然估计Maximum Likelihood Estimation)是一种统计学方法,用于估计一个未知参数的值,使得该参数下的样本观测值出现的概率最大。在概率论和统计学中,最大似然估计是一种常用的参数估计方法,被广泛应用于各种领域,如生物学、物理学、经济学等。 ### 回答2: 最大似然估计Maximum Likelihood Estimation,简称MLE)是一种常用的参数估计方法。它的核心思想是选择使得给定数据发生概率最大的参数值作为估计值。 在最大似然估计中,我们假设数据是从一个已知的概率分布中独立地抽取得到的。而我们的目标是找到使得观测数据的概率最大的参数值。具体地说,我们要找到一个参数的值,使得该参数设定下观测到的数据出现的概率最大。 最大似然估计的步骤通常包括以下几个步骤。首先,要明确选取的概率分布的形式,并给出这个概率分布的参数。然后,确定似然函数,即给定数据下参数的似然概率函数。接着,通过最大化似然函数,即找到使得似然函数最大的参数值。最后,得到的参数值就是最大似然估计值。 最大似然估计具有一些良好的性质。它是渐进无偏的,即当样本量趋向于无穷大时,最大似然估计的偏差趋于零。此外,最大似然估计还具有较高的效率,意味着它通常能够提供较小的方差。 最大似然估计广泛应用于各个领域,包括统计学、机器学习、经济学等。例如,在回归分析中,可以使用最大似然估计来估计回归模型的系数。在概率模型中,最大似然估计也经常用于参数估计。 总之,最大似然估计是一种常用的参数估计方法,通过最大化给定数据的可能性来得到参数估计值,具有一些良好的性质。它在统计学和其他领域都有广泛的应用。 ### 回答3: 最大似然估计是一种统计推断方法,用于估计概率分布的参数。它基于最大化样本观测到的数据出现的可能性,即最大化似然函数。 最大似然估计的基本思想是找到使得观测到的数据出现概率最大的参数。假设我们有一个概率模型和一些观测到的数据,我们可以通过调整模型参数的值来使得观测到的数据的概率最大化。这种方法可以用于确定连续或离散分布的参数,如正态分布的均值和方差。 最大似然估计的步骤如下:首先,我们需要选择一个合适的概率分布模型来描述数据的分布情况;然后,使用观测到的数据来构建似然函数,该函数描述了给定数据时参数的可能性;最后,通过最大化似然函数来估计概率分布的参数,找到使得观测数据出现的可能性最大的参数值。 最大似然估计具有很多优点,例如,它是一种无偏估计方法,意味着在大样本情况下,估计值将接近真实值。此外,最大似然估计还具有良好的渐近性质,可以在一定假设条件下提供一致的估计结果。 然而,最大似然估计也有一些限制。首先,它依赖于所选择的概率分布模型的正确性,如果选取的模型与实际数据不匹配,估计结果可能是不准确的。其次,当样本量较小时,估计结果可能不稳定,容易受到极端值的影响。 总的来说,最大似然估计是一种常用的估计方法,用于确定概率分布的参数。它具有很多优点,但也需要谨慎选择合适的概率模型,并注意样本量和极端值对估计结果的影响。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值