EM算法

最新推荐文章于 2020-11-17 19:13:54 发布

巧克力冰沙真好吃

最新推荐文章于 2020-11-17 19:13:54 发布

阅读量433

点赞数

分类专栏：算法文章标签：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013335688/article/details/72395966

版权

算法专栏收录该内容

10 篇文章 0 订阅

订阅专栏

适用问题

带有隐变量(无法直接观测的变量)的条件概率

P (Y, Z ∣ Θ)

$P(Y,Z\mid \Theta)$ Y是可观测变量，Z是隐变量，

Θ $\Theta$ 是模型参数

通过提供观测变量Y的观测值、Z的取值范围、 $P(Y,Z\mid\Theta)$ 、 $P(Z\mid Y,\Theta)$ , 计算出模型参数 $\Theta$

算法

这里写图片描述

原理

本质上是求

P (Y ∣ θ) = \sum Z P (Z ∣ θ) P (Y ∣ Z, θ)

$P(Y\mid \theta) = \sum_{Z}^{} P(Z\mid \theta) P(Y\mid Z,\theta)$
对

θ $\theta$ 的极大似然估计

θ ̂ = a r g m a x θ l o g P (Y ∣ θ)

$\hat{\theta} = argmax_{\theta}logP(Y\mid \theta)$
（

L(θ)=logP(Y∣θ)=∑ilog∑kP(Yi,Zk∣θ) $L(\theta) = logP(Y\mid \theta) = \sum_i log \sum_k P(Y_i,Z_k \mid \theta)$ ）

但是由于上式中包含了不可观测的Z的累加和包含和的对数，不能直接求导来确定 $\theta$

转化为通过使两次迭代之间的增加量最大来逼近最大值

E步：建立L(\theta)两次迭代间的下界

Q:为什么E步的Q函数的含义是在第i次迭代的 $\theta$ 和观测值 Y 的条件下L(\theta) 中z的期望呢（ $E_z[logP(Y,Z\mid \theta)\mid Y,\theta^{(i)}]$ ）

A:E步实际上是求在上一次迭代的\theta^{(i)}的基础上，Z的期望。下一步M步即是让L( $\theta$ )在取何值时 z的期望最大。在下一篇文章高斯混合模型中，可以在算法中用E(Z)代替计算

M步: 使下界极大（一般是分别使偏导为0）

在上一次迭代得到的 $\theta^{(i)}$ 的基础上，下一次迭代取值 $\theta$ 使

L (θ) - L (θ (i))

$L(\theta)-L(\theta^{(i)})$
的值取最大

利用Jensen不等式，可得

L (θ) - L (θ (i)) = \sum Z P (Z ∣ Y, θ (i)) l o g P ( Y ∣ Z , θ ) P ( Z ∣ θ ) P ( Z ∣ Y , θ ( i ) ) P ( Y ∣ θ ( i ) )

$L(\theta)-L(\theta^{(i)}) = \sum_{Z}P(Z\mid Y,\theta^{(i)})log\frac{P(Y\mid Z,\theta)P(Z\mid \theta)}{P(Z \mid Y,\theta^{(i)})P(Y\mid \theta^{(i)})}$
去除多余的常数的项也就是求

a r g m a x θ \sum Z P (Z ∣ Y, θ (i)) l o g P (Y, Z ∣ θ)

$argmax_{\theta} \sum_{Z}P(Z\mid Y,\theta^{(i)}) logP(Y,Z\mid \theta)$
作为本轮迭代产生的

θ(i+1) $\theta^{(i+1)}$

巧克力冰沙真好吃

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。