数据集分布拟合最大似然练习1

数据集对一个分布的似然率计算过程:

一个数据集可以是各种分布的,可以是高斯分布,指数分布等。但是它是这种分布的概率有多大呢?我们将计算每个点属于这个分布的概率。如果整个概率最大,那整体概率就高。

上图参考链接来自https://www.youtube.com/watch?v=XepXtl9YKwc

 例如要计算这个分别的概率,就是计算每个点属于这个分布的概率的乘积。由于概率越乘越小。可以选择用log来把乘变成加。例如gmm的分布概率推导,

为了保证数据的精度,推导如下:

先对数据求log变成log(P),然后 log likelihood就变成 log_sum_exp(log(P) ),而log_sum_exp的优化技巧:

参考链接https://www.xarg.org/2016/06/the-log-sum-exp-trick-in-machine-learning/

这里证明的是,我们可以保证e^x,中x的最大值为0,而不会发生溢出。

 

 

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值