机器学习——EM算法

最新推荐文章于 2022-11-23 23:02:57 发布

yfqh9588

最新推荐文章于 2022-11-23 23:02:57 发布

阅读量191

点赞数

文章标签：机器学习算法

本文链接：https://blog.csdn.net/qq_43635468/article/details/105940413

版权

EM算法是一种迭代优化策略，由于它的计算方法中每一次迭代都分两步，其中一个为期望步（E步），另一个为极大步（M步），所以算法被称为EM算法（Expectation Maximization Algorithm）。EM算法受到缺失思想影响，最初是为了解决数据缺失情况下的参数估计问题。
例如当两种高斯分布的人混在一块了，我们又不知道哪些人属于第一个高斯分布，哪些属于第二个，所以就没法估计这两个分布的参数。反过来，只有当我们对这两个分布的参数作出了准确的估计的时候，才能知道到底哪些人属于第一个分布，那些人属于第二个分布。所以这里就是说EM估计就是因为多了一个隐含变量（抽取得到的每个样本都不知道是从哪个分布抽取的）使得本来简单的可以求解的问题变复杂了。

EM算法的推导

随机变量 $X$ 是有 $K$ 个高斯分布混合而成，取各个高斯分布的概率为 $\pi_1,\pi_2,···,\pi_K。若观测到随机变量$ X$的一系列样本: $x_1,x_2,...,x_m$ ，包含m个独立样本，希望从中找到该组数据的模型 $p (x, z)$ 的参数。
对于这样多个高斯分布混合而成的模型，称作高斯混合模型（GMM）。
在这里插入图片描述
取对数似然函数

由于样本来自不同的高斯分布，我们并不知道每个样本来自哪个分布，因此这个似然函数无法求解。一个方法是考虑隐变量，用z标记样本来自哪个总体，则z就是隐变量，需要最大化的似然函数就变为：
在这里插入图片描述
似然函数求解
z是隐随机变量，不方便直接找到参数估计。策略：计算 $l(\theta)$ 下界函数，求该下界的最大值;重复该过程,直到收敛到局部最大值。

Jensen不等式

当x为常数时等号成立。

令 $Q_i$ 是z的某一个分布， $Q_i>=0$ ，有:
在这里插入图片描述
寻找尽量紧的下界
为了使等号成立：

得到 $Q (z)$ ，大功告成， $Q (z)$ 就是 $p(z_i|x_i)$ ，或者写成 $p(z_i)$ ，代表第 $i$ 个数据是来自 $z_i$ 的概率。

EM算法整体框架
首先，初始化参数θ
（1）E-Step：根据参数 $θ$ 计算每个样本属于 $z_i$ 的概率，这个概率就是 $Q$ ；
（2）M-Step：根据计算得到的 $Q$ ，求出含有 $θ$ 的似然函数的下界并最大化它，得到新的参数 $θ$ ;
　　重复（1）和（2）直到收敛。

yfqh9588

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习——EM算法

EM算法是一种迭代优化策略，由于它的计算方法中每一次迭代都分两步，其中一个为期望步（E步），另一个为极大步（M步），所以算法被称为EM算法（Expectation Maximization Algorithm）。EM算法受到缺失思想影响，最初是为了解决数据缺失情况下的参数估计问题。例如当两种高斯分布的人混在一块了，我们又不知道哪些人属于第一个高斯分布，哪些属于第二个，所以就没法估计这两个分布的参...
复制链接

扫一扫