【保研面试问题】——似然函数与概率密度函数

本文介绍了概率密度函数及其在描述随机变量概率特性中的作用,同时详细阐述了最大似然估计的概念,作为参数估计的重要方法。通过黑箱摸球的实例,展示了如何运用概率密度函数和最大似然估计来解决问题。最后,以高斯分布为例,解释了在一维正态分布中如何计算概率密度函数和应用最大似然估计进行参数估计。
摘要由CSDN通过智能技术生成

一、概率密度函数

概率密度函数是随机变量的函数,它是描述随机变量的输出值在某个取值点附近出现的可能性的函数。

二、最大似然估计

最大似然估计是机器学习中最常用的参数估计方法之一。在建模过程中,似然函数描述在不同的模型参数下真实数据发生的概率,它是关于模型参数的函数。

最大似然估计就是寻找最优参数(以正态分布为例,待求参数为均值\mu和方差\sigma^2),使观测数据发生的概率最大、统计模型与真实数据最相近。

三、举例直观说明

以在黑箱里摸球为例比较一下概率密度函数与最大似然估计。

3.1概率密度函数

已知箱子里有3个黑球、4个白球,不放回的摸两次。那么摸到2个白球的可能性是P=[C(1,4)*C(1,3)]/C(1,7)*C(1,6)=2/7

共有{一黑一白,两黑、两白}三种可能结果,将每种结果出现的概率计算出来,则得到离散序列的概率密度函数。

3.2最大似然估计

似然估计是根据观察到的结果来推测箱子里面球的分布情况,即“已知结果,反推原因

假设进行了一次实验,观察结果为{2白},根据此结果来估计箱内有几黑几白。将箱内的白球个数用\theta表示,实验结果用X表示:X={X1:摸到的第一个球为白球;X2:摸到的第二个球为白球}。则似然函数为

L(\theta ;X)=\prod_{i=1}^{2}P(\theta ;Xi)=[\frac{C(1,\theta )}{C(1,7)}]*[\frac{C(1,\theta-1 )}{C(1,6)}]

最大似然估计就是寻找最优参数\theta使观测数据出现的概率最大,也就是使似然函数最大化。

四、高斯分布的概率密度函数及似然函数

一维正态分布的概率密度函数为

随机变量X服从正态分布X\sim N(\mu ,\sigma ^2),\sigma >0

如果有n个可观察样本(可以理解为离散信号的点数),根据最大似然函数的公式有:

L(\mu,\sigma^2;X)=\prod_{i=1}^{n}f(xi;\mu,\sigma^2)=\prod_{i=1}^{n}\frac{1}{\sqrt{2\Pi }\sigma }exp(-\frac{(xi-\mu )^2}{2\sigma ^2})=(\frac{1}{\sqrt{2\Pi }\sigma })^nexp(\sum_{i=1}^{n}(-\frac{(xi-\mu )^2}{2\sigma ^2}))

因为似然函数和条件概率形式相同,只不过自变量不同。所以摘了维基百科上的解释:

 

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值