EM算法

最新推荐文章于 2020-02-23 13:44:00 发布

雪伦_

最新推荐文章于 2020-02-23 13:44:00 发布

阅读量3.6k

点赞数 3

分类专栏：机器学习文章标签：机器学习 EM算法

本文链接：https://blog.csdn.net/a819825294/article/details/53780544

版权

机器学习专栏收录该内容

17 篇文章 101 订阅

订阅专栏

1.背景知识

（1）期望

离散型

　　X1,X2,X3，……，Xn为这离散型随机变量，p(X1）,p(X2）,p(X3），……p(Xn)为这几个数据的概率函数。在随机出现的几个数据中p(X1）,p(X2）,p(X3），……p(Xn)概率函数就理解为数据X1,X2,X3，……，Xn出现的频率f(Xi).则：

　　设Y是随机变量X的函数：Y=g（X）（g（X）是连续函数）它的分布律为若绝对收敛，则有:

连续型

　　设连续性随机变量X的概率密度函数为f(x)，若积分绝对收敛，则称积分的值为随机变量的数学期望，记为E(X)。

　　若随机变量Y符合函数Y=g(x)，且绝对收敛，则有:

（2）Jensen不等式

　　最优化理论中的一些概念。设f是定义域为实数的函数，如果对于所有的实数x，，那么f是凸函数。当x是向量时，如果其hessian矩阵H是半正定的（），那么f是凸函数。如果或者，那么称f是严格凸函数。

　　Jensen不等式表述如下：

　　如果f是凸函数，X是随机变量，那么。特别地，如果f是严格凸函数，那么。当且仅当，也就是说X是常量。

　　如图所示，我们用f(E(X))简写成f(EX)。实线f是凸函数，X是随机变量，有0.5的概率是a，有0.5的概率是b。（就像掷硬币一样）。X的期望值就是a和b的中值了，图中可以看到成立。

　　当f是（严格）凹函数当且仅当-f是（严格）凸函数。

　　Jensen不等式应用于凹函数时，不等号方向反向，也就是。

2.初识EM

　　EM算法是一种迭代算法，1977年由Dempster等人总结提出，用于含有隐变量的概率模型参数的极大似然估计，或极大后验概率估计。EM算法的每次迭代有两步组成：E步，求期望。M步，求极大。所以这一算法称为期望极大算法（expectation maximization）,简称EM算法。

　　EM算法通过迭代求L（）= logP(Y|)的极大似然估计。每次迭代包含两步：E步，求期望。M步，求极大。

　　EM算法：

3.示例（三硬币模型）

　　假设有3枚硬币，分别记作A，B，C。这些硬币正面出现的概率分别是π，p，q。进行如下掷硬币试验：先掷硬币A，根据其结果选出硬币B或硬币C，正面选硬币B，反面选硬币C；然后掷选出的硬币，掷硬币的结果，出现正面记作1，出现反面记作0；独立重复n次试验（这里，n=10），观测结果如下：
　　　　　　　　　　　　　　　　1，1，0，1，0，0，1，0，1，1
　　假设只能观测到掷硬币的结果，不能观测掷硬币的过程。问如何估计三硬币正面出现的概率，即三硬币模型的参数。

　　三硬币模型可以写作：