关于EM算法的简单讲解

最新推荐文章于 2024-07-19 10:51:16 发布

Quincy1994

最新推荐文章于 2024-07-19 10:51:16 发布

阅读量2k

点赞数

分类专栏：数据挖掘文章标签： EM算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_30843221/article/details/54897389

版权

数据挖掘专栏收录该内容

14 篇文章 0 订阅

订阅专栏

EM算法

EM算法是一种迭代算法，1977年由Dempster等人总结提出，用于含有隐变量（hidden variable）的概率模型参数的极大似然估计，或极大后验概率估计。例如估计LDA中的隐变量topic的分布，高斯混合模型中观测数据来自第k个的高斯分布的概率数据。

EM算法的每次迭代由两步组成：E步，求期望（expection）;M步，求极大（maximization）

E步的公式如下：
这里写图片描述
M步的公式如下：

EM算法的两大定理：
定理一：观测数据的似然函数序列为单调递增，即P(Y| theta(i+1))>= P ( Y | theta(i))
定理二：如果似然函数有上界，那么似然函数序列收敛到某一值L

补充

数学期望：离散随机变量的一切可能取值与其对应的概率P的乘积之和。
最大似然估计：若X为离散型随机变量，其概率分布的形式为P{X=x}=p(x;theta). 当样本值确定时，所有样本的乘积可以看作是theta的函数，并称为似然函数。由于已经得到了样本值（x1,…,xn),那它的出现的可能性应该是大的，即似然函数的值应该是大的。因而我们选择使似然函数达到最大值的那个theta做为真theta的估计
参考文献：龙永红的《概率论与梳理统计》、李航的《统计学习方法》

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
关于EM算法的简单讲解

EM算法 EM算法是一种迭代算法，1977年由Dempster等人总结提出，用于含有隐变量（hidden variable）的概率模型参数的极大似然估计，或极大后验概率估计。例如估计LDA中的隐变量topic的分布，高斯混合模型中观测数据来自第k个的高斯分布的概率数据。EM算法的每次迭代由两步组成：E步，求期望（expection）;M步，求极大（maximization）E步的公式如下：
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。