从信息论的角度理解极大似然法

极大似然估计是一种概率论在统计学中的应用,建立在极大似然原理的基础上,极大似然原理的直观解释是:一个随机试验如有若干个可能的结果A、B、C、…,若在一次试验中,结果A出现,则一般认为试验条件对A出现有利,也即A出现的概率很大,那么就取参数估计,使A出现的概率最大。

设随机变量Y具有概率密度函数,θ是参数向量。当我们得到Y的一组独立观测值时,定义θ的似然函数为。极大似然法是采用使L(θ)最大的θ的估计值作为参数值。

为了计算方便,我们通常求使最大的θ的估计值,这与L(θ)最大是等价的,由于,当,几乎处处有


在观测样本已知的情况下,N是定值,那么,极大似然估计是使最大的θ的估计值。若Y的真实分布的密度函数为g(y),我们有


衡量两个分布g(·)和f(·|θ)差异性的统计量KL散度(或者相对熵)为:


只有当g(y)等于f(y|θ)时,KL散度才为0,因此,当随机变量Y给定时,为定值,最大化,就是最小化,即求最近似于g(y)f(y|θ)。这个解释从信息论的角度透彻地说明了极大似然法的本质。




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值