似然函数取对数的原因

不仅仅是减少计算量

在计算一个独立同分布数据集的联合概率时,如:

 

X={x1,x2,…,xN}X={x1,x2,…,xN}

 

其联合概率是每个数据点概率的连乘:

 

p(X∣Θ)=∏i=1Np(xi∣Θ)p(X∣Θ)=∏i=1Np(xi∣Θ)

 

两边取对数则可以将连乘化为连加

 

lnp(X∣Θ)=∑i=1Nlnp(xi∣Θ)ln⁡p(X∣Θ)=∑i=1Nln⁡p(xi∣Θ)

 

乘法变成加法,从而减少了计算量;同时,如果概率中含有指数项,如高斯分布,能把指数项也化为求和形式,进一步减少计算量;另外,在对联合概率求导时,和的形式会比积的形式更方便。

但其实可能更重要的一点是,因为概率值都在[0,1]之间,因此,概率的连乘将会变成一个很小的值,可能会引起浮点数下溢,尤其是当数据集很大的时候,联合概率会趋向于0,非常不利于之后的计算。

取对数不影响单调性

p(x∣Θ1)>p(x∣Θ2)⇔lnp(x∣Θ1)>lnp(x∣Θ2)p(x∣Θ1)>p(x∣Θ2)⇔ln⁡p(x∣Θ1)>ln⁡p(x∣Θ2)

这里写图片描述

因为相同的单调性,它确保了概率的最大对数值出现在与原始概率函数相同的点上。因此,可以用更简单的对数似然来代替原来的似然。

Reference:Why we consider log likelihood instead of Likelihood in Gaussian Distribution

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值