极大似然估计的总结

极大似然估计又叫最大似然估计(MLE,Maximum Likelihood Estimation),极大似然在数据分析领域中一般是对变量求偏导数或对矩阵求偏导数,然后偏导数为0求解一般为最小值解。因为统计领域大部分都是下凹的函数。随机误差为正态分布时,极大似然的求解正好为最小二乘求解。

极大似然原理:给定一个概率分布 D D D,已知其概率密度函数(连续分布)或概率质量函数(离散分布)为 f D f_D fD,设分布参数为 θ \theta θ,似然函数为:
L ( θ   ∣   x ( 1 ) , x ( 2 ) , . . . , x ( n ) ) = f θ ( x ( 1 ) , x ( 2 ) , . . . , x ( n ) ) \large{L(\theta\ |\ x^{(1)},x^{(2)},...,x^{(n)})=f_{\theta}(x^{(1)},x^{(2)},...,x^{(n)})} L(θ  x(1),x(2),...,x(n))=fθ(x(1),x(2),...,x(n))
f θ f_{\theta} fθ即为这个采样的概率,若是连续分布,其值为这些采样( x ( 1 ) , x ( 2 ) , . . . , x ( n ) x^{(1)},x^{(2)},...,x^{(n)} x(1),x(2),...,x(n))联合分布的概率密度函数在观测值处的取值。极大似然就是寻找 θ \theta θ可能的取值,使得样本值的概率最大化,也就是样本的可能性最大。所以从数学上就是使得似然函数的值最大,此时的 θ \theta θ的值称为极大似然估计。似然函数是样本的函数。

离散分布极大似然:假设有一个硬币,正反面重量不同,抛出正面的概率为 p p p,抛出反面的概率为 1 − p 1-p 1p。把这个硬币抛80次,正面记为 H H H,反面记为 T T T。得到一个样本: x ( 1 ) = H , x ( 2 ) = T , . . . , x ( 80 ) = T x^{(1)}=H,x^{(2)}=T,...,x^{(80)}=T x(1)=H,x(2)=T,...,x(80)=T,正面49次,反面31次。 p p p即为要求的 θ \theta θ。似然函数为:
L ( p ) = f D ( H = 49 , T = 31   ∣   p ) = ( 80 49 ) p 49 ( 1 − p ) 31 \large{L(p)=f_D(H=49,T=31\ |\ p)=\binom{80}{49}p^{49}(1-p)^{31}} L(p)=fD(H=49,T=31  p)=(4980)p49(1p)31

求偏导得:
0 = d d p ( ( 80 49 ) p 49 ( 1 − p ) 31 ) = p 48 ( 1 − p ) 30 [ 49 ( 1 − p ) − 31 p ] \large{\begin{aligned}0&=\frac{d}{dp}(\binom{80}{49}p^{49}(1-p)^{31})\\ &=p^{48}(1-p)^{30}[49(1-p)-31p]\end{aligned}} 0=dpd((4980)p49(1p)31)=p48(1p)30[49(1p)31p]
得到 p = 0 , p = 1 , p = 49 80 p=0,p=1,p=\frac{49}{80} p=0,p=1,p=8049,这个值可以扩展成一般化 p = k n p=\frac{k}{n} p=nk

连续分布极大似然:连续型似然函数值最大也就是指概率密度函数值的乘积最大(前提是每个样本是独立的,基本都是独立的,这里带验证?)。公式如下:
L ( θ ) = ∏ i = 1 n f θ ( x ( i ) ) \large{L(\theta)=\prod_{i=1}^nf_{\theta}(x^{(i)})} L(θ)=i=1nfθ(x(i))
一般连续概率分布都服从正太分布 ( μ , σ 2 ) (\mu, \sigma^2) (μ,σ2)(实际应用中误差项多服从 ( 0 , σ 2 ) (0, \sigma^2) (0,σ2))。似然函数为:
∏ i = 1 n 1 2 π σ exp ⁡ ( − ( x ( i ) − μ ) 2 2 σ 2 ) ( θ = ( μ , σ 2 ) ,也就是参数 θ 由 μ 和 σ 组成 ) \large{\prod_{i=1}^n\frac1{\sqrt{2\pi}\sigma}\exp{(-\frac{(x^{(i)}-\mu)^2}{2\sigma^2})}\quad\\(\theta=(\mu,\sigma^2),也就是参数\theta由\mu和\sigma组成)} i=1n2π σ1exp(2σ2(x(i)μ)2)(θ=(μ,σ2),也就是参数θμσ组成)
然后取对数,乘法转为加法,接着求偏导数,并令其等于0得:
μ ^ = 1 n ∑ i = 1 n x ( i ) , σ ^ 2 = 1 n ∑ i = 1 n ( x ( i ) − μ ^ ) 2 \large{\hat\mu=\frac1n\sum_{i=1}^nx^{(i)},\quad\hat\sigma^2=\frac1n\sum_{i=1}^n(x^{(i)}-\hat\mu)^2} μ^=n1i=1nx(i),σ^2=n1i=1n(x(i)μ^)2

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值