【机器学习】手推EM算法

最新推荐文章于 2024-08-22 10:35:16 发布

哈乐笑

最新推荐文章于 2024-08-22 10:35:16 发布

阅读量4.1k

点赞数 2

分类专栏：机器学习文章标签：机器学习统计学

本文链接：https://blog.csdn.net/haolexiao/article/details/61198751

版权

本文介绍了EM算法的原理和应用，通过解析琴生不等式来理解算法的基础。EM算法在处理含有隐含变量的问题时，通过E步骤和M步骤进行迭代优化，例如在三硬币概率估计和混合高斯模型中的应用。通过对最大似然函数的处理，利用琴生不等式确保优化过程的有效性。

摘要由CSDN通过智能技术生成

Andrew Wu那门《机器学习》真的是太好了，每次看都有不少新收获，今天打算重新回顾一下EM算法来着，结果看李航的《统计学习方法》发现之前的理解有不少错误，又重新开始研究，结果都不是很明白，看Andrew Wu的视频，顿时就明白了。大牛果然是大牛。

EM算法是一个非常经典的非监督学习算法。
一般手推EM算法，需要先说琴生不等式【Jensen不等式】

琴生不等式

如果一个函数是凸函数： $f(\vec x)$ 的Hessian矩阵 $\nabla ^2f$ 是一个半正定矩阵，则其是一个凸函数。那么其满足琴生不等式：

E [f (X)] \geq f (E X)

$E[f(X)] \geq f(EX)$

等号取到的条件

如果 $\nabla ^2f$ 是一个正定矩阵,则等号取到的条件是其中的 $X$ 是一个定值,即 $X$ 是相等的

EM算法

数理统计的基本问题就是根据样本所提供的信息，对总体的分布或者分布的数字特征作出统计推断。在EM算法中，变量并不直接是观测变量，而是含有隐含变量。如果随机变量都是可以观测的，那么直接用最大似然估计就能求出来了。但是它并不是直接可以观测的。
比如李航的《统计学习方法》中，举的那个例子，3枚硬币投出正面的概率分别为{p,q,r}，然后先投第一枚硬币，如果第一枚朝正面，则投第二枚硬币得到其值；如果反面则投第三枚硬币得到其值。现在有一个序列的观测值，问从这个观测序列中，求出{p,q,r}
因为第一枚硬币的投出的结果是不可直接观测的，所以就有了这么一个隐含的变量。
再比如混合高斯模型也是这样，并不知道每个节点的类别，所以每个节点的类别是隐含变量。【K-means也是如此】

EM算法的优化过程直观理解是如下图的，即当前节点 $\theta _n$ 是如下的位置然后找到当前函数的一个下界,且这个下界是可以在 $\theta _n$ 节点取到的.然后再找出这个下界的最大值,其横坐标就为 $\theta _{n+1}$
所以上面找下界的步骤是E步骤,找下界最大值求出 $\theta _{n+1}$ 的步骤是M步骤