EM算法及其推广

最新推荐文章于 2022-07-07 16:31:37 发布

tt12121221

最新推荐文章于 2022-07-07 16:31:37 发布

阅读量166

点赞数

文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tonglingwen/article/details/107238282

版权

EM算法及其推广

EM算法的引入

EM是一种迭代算法，用于 含有隐含量的 概率模型的 极大似然估计，或 极大后验概率估计。EM算法的每次迭代由两步组成: E步求期望；M步求极大。所以这一算法称为期望极大算法，简称EM算法。

EM算法的引入

概率模型有时既含有观测变量，又含有隐变量或潜在变量。当模型含有隐变量时，就不能简单地使用这些估计方法。EM 算法就是含有隐变量的概率模型参数的估计似然估计法。
将观测数据表示为 $Y=\lbrace Y_1,Y_2,...,Y_n \rbrace$ ,未观测数据表示为 $Z=(Z_1,Z_2,...,Z_n)^T$ ,则观测数据的似然函数为 $P(Y|\theta)=\sum_ZP(Z|\theta)P(Y|Z,\theta)$ 考虑求模型参数 $\theta=(\pi,p,q)$ 的极大似然估计，即 $\hat{\theta}=\argmax_{\theta}logP(Y|\theta)$ 这个问题没有解析解，只能通过迭代的方法求解。EM算法就是可以用于求解这个问题的一种迭代算法。
算法如下：
输入：观测变量数据 $Y$ ,隐变量数据 $Z$ ,联合分布 $P(Y,Z|\theta)$ ，条件分布 $P(Z|Y,\theta)$
输出：模型参数 $\theta$

选择参数初值 $\theta(0)$ ,开始迭代
E步：记 $\theta(i)$ 为第 $i$ 次迭代参数 $\theta$ 的估计值，在第 $i + 1$ 次迭代的E步，计算 $Q(\theta,\theta^{(i)})=E_Z[logP(Y,Z|\theta)|Y,\theta^{(i)}]=\sum_ZlogP(Y,Z|\theta)P(Z|Y,\theta^{(i)})$ 这里， $P(Z|Y,\theta^{(i)})$ 是在给定观测数据 $Y$ 和当前的参数估计 $\theta^{(i)}$ 下隐变量数据 $Z$ 的条件概率分布
M步：求使 $Q(\theta,\theta^{(i)})$ 极大化的 $\theta$ ，确定第 $i + 1$ 次迭代的参数的估计值 $\theta^{(i+1)}$ $\theta^{(i+1)}=\argmax_{\theta}Q(\theta,\theta^{(i)})$
重复第2步和第3步，直到收敛。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。