机器学习：EM算法

最新推荐文章于 2024-07-19 10:51:16 发布

兔子爱读书

最新推荐文章于 2024-07-19 10:51:16 发布

阅读量1k

点赞数

分类专栏：机器学习专栏：机器学习知识图谱

未经许可禁止转载！

本文链接：https://blog.csdn.net/ztf312/article/details/50935512

版权

机器学习同时被 2 个专栏收录

89 篇文章 22 订阅

订阅专栏

专栏：机器学习知识图谱

25 篇文章 54 订阅

订阅专栏

1. 定义

EM(Expectation Maximization), 期望极大算法，是一种从不完全数据或有数据丢失的数据集（存在隐含变量）中求解概率模型参数的最大似然估计方法。用户含有隐变量的的概率模型参数的极大似然估计，或称极大后验概率估计法。

EM应用：高斯混合模型、隐马尔可夫模型的模型学习。

EM推广：GEM算法。

2. 原理

《统计学习方法》一书中给出一个案例“三硬币模型”：EM算法学习(Expectation Maximization Algorithm)

有3个硬币，分布为A、B、C，硬币正面的概率是pai，p，q。投币实验如下，先投A，如果A是正面，即A=1，那么选择投B；A=0，投C。最后，如果B或者C是正面，那么y=1；是反面，那么y=0；投n次，n=0，结果序列是：1,1,0,1,0,0,1,0,1,1

解：设随机变量y是观测变量，则投掷一次的概率模型为

这里涉及一个条件概率：多变量条件概率等价式推导

证明过程借鉴别人的图如下：

Θ是向量pai，p，q。y是观察到的硬币最终的正反面。Z是硬币A的投掷结果，是没有未观察到的。

有n次观测数据Y，那么观测数据Y的似然函数为

那么利用最大似然估计求解模型解，即

这里将概率模型公式和似然函数代入（1）式中，可以很轻松地推出 (1)=> (2) => (3)，然后选取θ(π,p,q)，使得（3）式值最大，即最大似然。然后，我们会发现因为（3）中右边多项式+符号的存在，使得（3）直接求偏导等于0或者用梯度下降法都很难求得θ值。

  这部分的难点是因为（3）多项式中+符号的存在，而这是因为这个三硬币模型中，我们无法得知最后得结果是硬币B还是硬币C抛出的这个隐藏参数。那么我们把这个latent 随机变量加入到 log-likelihood 函数中，得

  略看一下，好像很复杂，其实很简单，请容我慢慢道来。首先是公式（4），这里将zi做为隐藏变量，当z1为结果由硬币B抛出，z2为结果由硬币C抛出，不难发现


注：一下Q中有些许漏了下标j,但不影响理解

接下来公式说明（4）=> （5）（其中（5）中Q(z)表示的是关于z的某种分布，），很直接，在P的分子分母同乘以Q(zi)。最后是（5）=>（6），到了这里终于用到了第二节介绍的Jensen不等式，数学好的人可以很快发现，

   就是的期望值