EM算法总结

最新推荐文章于 2024-01-21 22:34:05 发布

cer_ml

最新推荐文章于 2024-01-21 22:34:05 发布

阅读量778

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/applenob/article/details/51474411

版权

机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

0.EM

EM算法的目标是找到具有隐变量的模型的最大似然解。

1.普通的极大似然估计

概率模型没有隐变量时，似然函数：

L (θ) = L (x 1, . . ., x n; θ) = \prod i = 1 n p (x i; θ), θ \in Θ

$L(θ)=L(x_1,...,x_n;θ)=\prod^n_{i=1}p(x_i;θ),θ∈Θ$
这个概率反映了：在概率密度函数的参数是θ时，得到X这组样本的概率。
θ的极大似然估计：

θ^= a r g m a x L (θ)

$\hatθ=argmaxL(θ)$
或者使用对数似然函数：

L L (θ) = l o g L (θ) = \sum i = 1 n l o g p (x i; θ)

$LL(θ)= logL(θ)=\sum^n_{i=1}logp(x_i;θ)$

2.EM算法的引入

概率模型有时既含有观测变量，有含有隐变量。

2.1 写出对数似然函数

L L (θ) = \sum i = 1 n l o g p (x i; θ) = \sum i = 1 n l o g \sum z (i) p (x (i), z (i); θ)

$LL(θ)=\sum^n_{i=1}logp(x_i;θ) =\sum^n_{i=1}log\sum_{z^{(i)}}p(x^{(i)},z^{(i)};θ)$
由于上式中存在“和的对数”的形式，所以不能像原来一样直接求导求解析解。这时就需要EM算法。
对数似然函数简单写法：

l n p (X | θ) = l n {\sum Z p (X, Z | θ)}

$lnp(X|θ)= ln\{\sum_Zp(X,Z|θ)\}$

2.2 实际情况

在实际应用中，我们通常没有完整数据集{X,Z}，只有不完整数据集{X}。

2.3 Q函数（核心）

Q函数是完全数据的对数似然函数logP(X,Z|θ)关于给定观测数据X和当前参数 $θ^{(i)}$ 的隐变量的后验概率分布 $P(Z|X,θ^{(i)})$ 的期望。

Q (θ, θ (i)) = E z [l n P (X, Z | θ) | X, θ (i)] = \sum Z P (Z | X, θ (i)) l n P (X, Z | θ)

$Q(θ,θ^{(i)})=E_z[lnP(X,Z|θ)|X,θ^{(i)}] =\sum_ZP(Z|X,θ^{(i)})lnP(X,Z|θ)$
个人理解：
很多地方，Q函数指的是观测数据Z的条件概率分布

P(Z|X,θ(i)) $P(Z|X,θ^{(i)})$ 。这样写，是在推导EM算法的时候，使用Jensen不等式很方便。但是在理解EM算法的过程中，还是李航老师的这种表达比较容易理解。
记忆：取对数释然函数的主体P(X,Z|θ)，前面加对数ln，然后关于已知的P(Z|X,θ)的期望。
另外

Q(θ,θ(i)) $Q(θ,θ^{(i)})$ 这样的表述方式容易让人迷惑。可以理解这还是一个关于θ的函数，但是会用到上一次更新的θ值。

2.4 EM算法过程

（1）选择参数的初值 $θ^{(0)}$ ，开始迭代；
（2）E步：
计算

Q (θ, θ (i)) = E z [l n P (X, Z | θ) | X, θ (i)] = \sum Z l n P (X, Z | θ) P (Z | X, θ (i))

$Q(θ,θ^{(i)})=E_z[lnP(X,Z|θ)|X,θ^{(i)}] =\sum_ZlnP(X,Z|θ)P(Z|X,θ^{(i)})$
（3）M步：

θ (i + 1) = a r g m a x Q (θ, θ (i))

$θ^{(i+1)}=argmaxQ(θ,θ^{(i)})$
（4）停止迭代的条件：
一般给定两个较小的正数

ε1,ε2 $ε_1,ε_2$
若满足

| | θ (i + 1) - θ (i) | | < ε 1

$||θ^{(i+1)}-θ^{(i)}||<ε_1$ 或

| | Q (θ (i + 1), θ (i)) - Q (θ (i), θ (i)) | | < ε 2

$||Q(θ^{(i+1)},θ^{(i))}-Q(θ^{(i)},θ^{(i)})||<ε_2$
则停止迭代。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
EM算法总结

1.普通的极大似然估计概率模型没有隐变量时，似然函数： L(θ)=L(x1,...,xn;θ)=∏i=1np(xi;θ),θ∈ΘL(θ)=L(x_1,...,x_n;θ)=\prod^n_{i=1}p(x_i;θ),θ∈Θ 这个概率反映了：在概率密度函数的参数是θ时，得到X这组样本的概率。 θ的极大似然估计： θ^=argmaxL(θ)\hatθ=argmaxL(θ) 或者使用对数似然函数
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。