EM算法的原理以及推广参考《统计学习方法》

xjtu_rzc

于 2020-02-06 15:30:16 发布

阅读量5k

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39320588/article/details/104171494

版权

EM算法是一种迭代方法，用于含有隐变量的概率模型参数估计。通过三硬币模型介绍，详细解释了E步和M步的计算过程，并探讨了初值选择对结果的影响及迭代停止条件。实例展示EM算法能有效估计高斯混合模型参数。

摘要由CSDN通过智能技术生成

EM算法是一种迭代算法，用于含有隐变量的概率模型参数的极大似然估计，或极大后验概率估计
首先引入：三硬币模型
假设有三枚硬币，分别记作 $A, B, C$ 。这些硬币正面出现的概率分别为 $\pi,p,q$ 。首先抛 $A$ 硬币，根据其结果选择抛 $B, C$ 硬币。正面选 $B$ ，反面选 $C$ ，然后记录最终硬币出现的结果。观测结果如下：
$1, 1, 0, 1, 0, 0, 1, 0, 1, 1$
只能观测到硬币投掷的结果，不能观测到过程。问如何估计三枚硬币正面出现的概率。
三硬币模型可以写成：
$P(y|\theta)=\pi p^y(1-p)^{1-y}+(1-\pi)q^y(1-q)^{1-y}$
采用极大似然估计，似然函数为：
$P(Y|\theta)=\prod_{j=1}^n[\pi p^{y_j}(1-p)^{1-y_j}+(1-\pi)q^{y_j}(1-q)^{1-y_j}]$
最终需要求的是：
$\hat{\theta}=\argmax_{\theta}\log P(Y|\theta)$
此问题没有解析解，因此需要采取迭代的方法求解。

EM算法
首先给定初值 $\theta^{(0)}=(\pi^{(0)},p^{(0)},q^{(0)})$ ，然后不断计算，直至收敛为止。已知第 $i$ 次的参数估计值为

最低0.47元/天解锁文章

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。