EM算法(Expectation-maximization algorithm)小结

最新推荐文章于 2024-07-14 06:30:00 发布

IceelfLuo

最新推荐文章于 2024-07-14 06:30:00 发布

阅读量839

点赞数 1

分类专栏：算法文章标签： em

本文链接：https://blog.csdn.net/iceelfluo/article/details/108559105

版权

EM算法是一种用于不完全数据的最大似然估计优化算法，由Dempster等人在1977年提出。它通过迭代求解混合高斯分布的参数，涉及隐变量的概念。在数据挖掘、机器学习等领域有广泛应用。算法包括E-step（期望步骤）和M-step（最大化步骤），可能面临收敛速度慢和依赖初始值的问题。

摘要由CSDN通过智能技术生成

EM算法（Expectation-Maximization algorithm）是一类通过迭代进行极大似然估计的优化算法，今天翻出了之前的笔记，在这里也放一下吧。

EM算法背景

EM（expectation-maximization）算法是Dempster,Laird和Rubin(DLR)三个人在1977年正式提出的.主要是用于在不完全数据的情况下计算最大似然估计.在EM算法正式提出以来，人们对EM算法的性质有更加深入的研究.并且在此基础上，提出了很多改进的算法.在数理统计，数据挖掘，机器学习以及模式识别等领域有广泛的应用.

问题背景

给定一些观察数据y，假设y符合如下的高斯分布：
$p(y)=\sum_{k=1}^{K} \theta_{k} N\left(y \mid \mu_{k}, \Sigma_{k}\right)$
需要求出混合高斯分布的三组参数： $\theta_{k}, \mu_{k}, \Sigma_{k}$
我们注意到，该混合高斯分布一共有K个分布函数，对于每一个观察到的样本y，如果知道它是属于K中的哪个分布，那么求这些参数就会变得很简单。因此我们考虑引入一组新的变量z，用 $z_{i}$ 来表示这些高斯分布，那么我们的样本集就会变为 $\left\{\left(y_{1}, z_{2}\right),\left(y_{2}, z_{5}\right),\left(y_{3}, z_{1}\right), \ldots\right\}$

隐变量

上面提到的新的变量z就是隐藏变量，这是由于实际问题中我们往往不知道每个y属于哪个分布，我们观察不到z.我们引入： $Z=\left\{b_{1}, b_{2}, \ldots, b_{K}\right\}$ 这里的 $b_{K}$ 取0或1，那么就有： $p\left(z_{k}=1\right)=\theta_{k}$ ，更进一步我们可以得到：
$p\left(Z\right)=\prod_{k=1}^{K} \theta_{k}^{z_{k}}$
最终，我们可以得到：
$p\left(y \mid z_{k}=1\right)=N\left(y \mid \mu_{k}, \Sigma_{k}\right)\\ \Rightarrow p\left(y \mid Z\right)=\prod_{k=1}^{K} N\left(y \mid u_{k}, \Sigma_{k}\right)^{z_{k}}$