最大似然与EM算法理解

最新推荐文章于 2024-05-30 14:59:53 发布

Mark_Aussie

最新推荐文章于 2024-05-30 14:59:53 发布

阅读量352

点赞数 1

原文链接：https://blog.csdn.net/zouxy09/article/details/8537620

版权

最大似然估计 EM算法似然函数参数估计 Jensen不等式

关键词由CSDN通过智能技术生成

似然函数：在已经抽到这一组样本X的条件下，估计参数θ的值，θ代表指定的分布参数。

最大似然估计可看作是一个反推，通常根据已知条件推算结果，而最大似然估计是已知结果，然后寻求使该结果出现的可能性最大的条件，以此作为估计值。

极大似然估计，概率论在统计学的应用，参数估计的方法之一。已知某个随机样本满足某种概率分布(即已知样本符合某种分布)，但具体参数不清楚，参数估计就是通过若干次试验，观察其结果，利用结果推出参数的大概值。最大似然估计是建立在这样的思想上：已知某个参数能使这个样本出现的概率最大，把这个参数作为估计的真实值。

求最大似然函数估计值的一般步骤：

（1）写出似然函数；

（2）对似然函数取对数，并整理；

（3）求导数，令导数为0，得到似然方程；

（4）解似然方程，得到的参数即为所求；

EM算法：样本的分布未知，相比似然函数多了一个位置参数。

期望最大算法是一种从不完全数据或有数据丢失的数据集（存在隐含变量）中求解概率模型参数的最大似然估计方法。

θ代表分布参数，z是可能的分布，Q为z的概率密度函数

Jensen不等式：设f是定义域为实数的函数，如果对于所有的实数x，f(x)的二次导数大于等于0，那么f是凸函数。当x是向量时，如果其hessian矩阵H是半正定的，那么f是凸函数。如果只大于0，不等于0，那么称f是严格凸函数。

如果f是凸函数，X是随机变量，那么：E[f(X)]>=f(E[X])

如果f是严格凸函数，当且仅当X是常量时，上式取等号。

Jensen不等式应用于凹函数时，不等号方向反向。

log函数的二阶导小于0，为凹函数。

此处较难理解，根据如下

Lazy Statistician规则

K-Means中的EM思想：

目的是将样本分成k个类，就是求每个样例x的隐含类别y，利用隐含类别将x归类。由于事先不知道类别y，对每个样例假定一个y，使用样本的极大似然估计度量，这里就是x和y的联合分布P(x,y)。如果找到的y能够使P(x,y)最大，那么y就是样例x的最佳类别了，x顺手就聚类了。

E步就是估计隐含类别y的期望值，M步调整其他参数使得在给定类别y的情况下，极大似然估计P(x,y)能够达到极大值。在其他参数确定的情况下，重新估计y，直至收敛。

参考：

https://blog.csdn.net/zouxy09/article/details/8537620

https://www.cnblogs.com/jerrylead/archive/2011/04/06/2006924.html(EM推导)

https://www.cnblogs.com/jerrylead/archive/2011/04/06/2006910.html

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

博客等级

码龄9年

231
原创

377
点赞

1491
收藏

240
粉丝

关注

私信

热门文章

分类专栏

Python 56篇
nlp 60篇
机器学习 47篇
AIOps 32篇
排序算法 9篇
C语言
JDK翻译 5篇
数据库 4篇

最新评论

Python Logging 的使用
北风之神c: 总结的很全面，写得赞，博主用心了。此国产日志 https://nb-log-doc.readthedocs.io/zh-cn/latest/articles/c1.html 使用原生 loggng封装，兼容性和替换性100%,只需要一行代码大幅简化logging的使用。 1、日志能根据级别能够自动变彩色。 1 2、print自动变彩色。 3、日志和print在pycahrm控制台的输出都自动可以点击跳转到文件和行号。 4、多进程日志切割安全，文件日志写入性能高。 5、入参简单，能一键自动记录到多种地方。 6、 nb_log 兼容包含loguru色彩模式,loguru只是nb_log的子集之一. 相比 loguru 有10胜。 pip install nb_log 。
python 常用方法记录
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性。
Log BERT 日志异常检测
qq_45834721: 问一下大家有复现出论文里面提到的效果吗
Log BERT 日志异常检测
lym4a1: 这个本来就是没到语义那一级，你还在做这方面研究吗？你对参数异常这块有什么想法吗
LSTM理解及梯度消失与爆炸
CSDN-Ada助手: 百度的paddlepadle库做的不错，不知道是否用过呢？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。