期望最大化（Expectation Maximization）算法介绍

最新推荐文章于 2025-04-02 13:57:26 发布

Y学习使我快乐V

最新推荐文章于 2025-04-02 13:57:26 发布

阅读量1w

点赞数 8

分类专栏：机器学习文章标签：期望最大化 EM Expectation Maximization

本文链接：https://blog.csdn.net/qq_24519677/article/details/82383306

版权

期望最大化（EM）算法是一种在数据集存在缺失值或隐变量时用于最大似然估计的迭代方法。算法包括E步（期望）和M步（最大化）两个阶段，通过不断迭代寻找模型参数的局部最优解。EM算法虽然不保证找到全局最优，但在许多概率模型如HMM和LDA中起到关键作用。其收敛性得到保证，但初值选择对结果影响较大。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

一. 前言

期望最大化（Expectation Maximization）算法（EM算法）在实际的应用中受到的关注不是特别的重，但是在学术中EM算法是其它很多算法的基础，如隐马尔科夫算法（HMM），LDA主题模型的变分推断等等。所以，理解EM算法对其它算法的学习还是很重要的。本文是对期望最大化算法（EM算法）做一个总结。

概率模型有时既含有观测变量，又含有隐变量。如果概率模型的变量都是观测变量，那么给定数据，可以直接用极大似然估计法或贝叶斯估计法估计参数模型。但是，当模型含有隐变量或者含有缺失值的时候，就不能简单地使用这些方法估计了。EM算法就是一个在数据集中有缺失值或者含有隐变量的时候能有效的计算最大似然估计的迭代过程。

EM算法包含两个步骤，E步和M步。E步也就是我们求期望的步骤，M步将E步所求的期望最大化，重复E步和M步直到收敛，也就是我们估计的模型参数不再发生变化或者变化幅度很小。这就是EM算法的基本概括，下面我们来详细的介绍EM算法。