EM 算法

最新推荐文章于 2021-02-02 00:26:22 发布

守望者tt

最新推荐文章于 2021-02-02 00:26:22 发布

阅读量231

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012756814/article/details/79995411

版权

机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

EM 算法

如果概率模型的变量都是观测变量，那么给定数据，可以直接使用极大似然估计法。但当模型含有隐含变量时，不能简单的进行极大似然估计，需要EM算法。因此EM算法是对含有隐含变量的概率模型参数进行极大似然估计。

为了说明EM算法，首先介绍Jession不等式。

Jession inequality

如果 f 为凸函数 $f''(x)\geq 0$ ,那么 $f(E(x)) \leq E(f(x))$

如果 f 为凹函数 $f''(x)\leq 0$ ,那么 $f(E(x)) \geq E(f(x))$

$f(E(x)) = E(f(x))$ 的充要条件是随机变量x在概率1下取相同值。

下面来推导EM算法：

模型： $P(x,z,\theta)$

仅观测到 x

目标：最大化极大似然函数 $l(\theta) =\sum_{i=1}^mlog(P(x^i,\theta)) =\sum_{i=1}^mlog(\sum_{z^i}P(x^i,z^i\theta))$

上述问题的难点是log中含有加法。

基本精神 ：初始化参数 $\theta$ ，建立一个对数似然函数的比较紧密的下界，猜测参数之后，找到这个函数取最大值的 $\theta$ ，并重复上述过程，直到收敛到函数的一个局部最优值（不保证达到全局最优解）。

$l(\theta) = \sum_ilog(P(x^i,\theta)) =\sum_{i=1}log(\sum_{z^i}P(x^i,z^i,\theta))$

$=\sum_{i=1}log(\sum_{z^i}Q(z^i)\frac{P(x^i,z^i,\theta))}{Q(z^i)}$

其中 $Q_i(z^i)$ 为 $z^i$ 的一个概率分布

$=\sum_ilog E_{z^i \in Q}[\frac{P(x^i,z^i,\theta))}{Q(z^i)}]$

根据Jession不等式，有

$\geq \sum_iE_{z^i \in Q}[log(\frac{P(x^i,z^i,\theta))}{Q(z^i)})]$

$=\sum_i\sum_{z^i}Q(z^i)log(\frac{P(x^i,z^i,\theta))}{Q(z^i)})$

当 $\frac{P(x^i,z^i,\theta))}{Q(z^i)}$ 以概率1取恒定值时，等号成立，因此，获得原始函数的一个紧密的下界。选取合适的 $Q(z^i)$ 使得等式成立。

根据 $\frac{P(x^i,z^i,\theta))}{Q_i(z^i)} =constant$ ,可以得到： $Q(z^i)$ 正比于 $P(x^i,z^i,\theta)$

$\sum_{z^i}Q(z^i) = 1$

根据上边两式可以得到： $Q(z^i) = \frac{P(x^i,z^i,\theta)}{\sum_{z^i}P(x^i,z^i,\theta)} = \frac{P(x^i,z^i,\theta)}{P(x^i,\theta)} =P(z^i|x^i,\theta)$

因此EM算法总结如下：

E-step：

计算 $Q_i(z^i) = P(z^i|x^i,\theta)$

M-step:

最大化紧却下界函数：

$\theta = argmax_{\theta}\sum_i\sum_{z^i}Q(z^i)log(\frac{P(x^i,z^i,\theta))}{Q(z^i)})$

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

守望者tt CSDN认证博客专家 CSDN认证企业博客

码龄11年

10: 原创

40万+: 周排名

160万+: 总排名

1万+: 访问

: 等级

228: 积分

20: 粉丝

19: 获赞

2: 评论

26: 收藏

私信

关注

热门文章

分类专栏

深度学习 6篇
NLP 1篇
机器学习 4篇

最新评论

卷积神经网络
佩洛君: 这位仁兄，请问你这个画图软件叫什么，因为AlexNet论文里的网络图太丑了，想自己手动画一个，谢谢
从VC维角度理解正则化与偏差方差权衡
Eooming: 您好，我对您文章中‘集成提升泛化能力的数学基础’片段的公式推导不太懂，可否加我qq交流一下，我的qq1120884684，多谢！

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。