机器学习算法——EM算法

最新推荐文章于 2023-12-22 23:15:10 发布

爱学习的影峰

最新推荐文章于 2023-12-22 23:15:10 发布

阅读量3.6k

点赞数 8

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_20840025/article/details/80004767

版权

机器学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

EM算法是一种迭代算法，分为E、M两步。他就是含有隐变量的概率模型参数的极大似然估计法，或极大后验概率估计法 (将求已知量P（Y|θ）转换为求隐变量P（Y|Z,θ）P（Z|θ）的过程）

E步：利用当前估计的参数值，求出在该参数下隐含变量的条件概率值（计算对数似然的期望值）；

M步：结合E步求出的隐含变量条件概率，求出似然函数下界函数的最大值（寻找能使E步产生的似然期望最大化的参数值。）然后，新得到的参数值重新被用于E步.....直到收敛到局部最优解。（note：每次迭代实际在求Q函数及其极大，即每次迭代使似然函数增大或达到局部极值。）

优点：简单性和普适性，可看作是一种非梯度优化方法（解决梯度下降等优化方法的缺陷：求和的项数将随着隐变量的数目以指数级上升，会给梯度计算带来麻烦）

缺点：对初始值敏感，不同的初值可能得到不同的参数估计值；不能保证找到全局最优值。

一、Jensen 不等式

在EM算法的推导过程中，用到了数学上的Jensen不等式，这里先来介绍一下。

其中，

　　

二、EM算法推导

面对一个含有隐含变量Z的概率模型，目标是极大化观测数据Y关于参数 θ 的对数似然函数，即极大化：

事实上，EM算法是通过迭代逐步极大化L(θ)的。假设在第i次迭代后θ的估计值是θ(i)。我们希望新的估计值θ能使L(θ)增加，即L(θ)>L(θ(i)),并逐步达到极大值。为此考虑两者的差：

上式利用了Jensen不等式，且∑zP(Z|Y;θ(i))=1，则可得上述推导。注意log为凹函数，不等号要改变方向

令

EM算法并不能保证全局最优值，直观解释如图所示。好好理解这个图
这里写图片描述

这里写图片描述

三、EM算法在高斯混合模型中的应用：

高斯混合模型：

步骤：（1）明确隐变量，写出完全数据的对数似然函数。

（2）EM算法的E步：确定Q函数（即：完全数据的对数似然函数关于在给定观测数据和参数的条件下对隐变量的条件概率的期望）：

（3）M步：求Q函数对theta的极大值，即求新一轮迭代的模型参数。

四、采用EM算法求解的模型有哪些？为什么不用牛顿法或者梯度下降法？

一般有混合高斯、协同过滤、k-means。算法一定会收敛，但是可能会收敛到局部最优。求和的项数会随着隐变量的数目指数上升，会给梯度计算带来麻烦。EM算法是一种非梯度优化算法。

五、用EM算法推导解释K-means：

k-means算法是高斯混合聚类在混合成分方差相等，且每个样本仅指派一个混合成分时候的特例。k-means算法与EM算法的关系是这样的：

注意k-means在运行之前需要进行归一化处理，不然可能会因为样本在某些维度上过大导致距离计算失效。

k-means中每个样本所属的类就可以看成是一个隐变量，在E步中，我们固定每个类的中心，通过对每一个样本选择最近的类优化目标函数，在M步，重新更新每个类的中心点，该步骤可以通过对目标函数求导实现，最终可得新的类中心就是类中样本的均值。

·1k-means是两个步骤交替进行:确定中心点，对每个样本选择最近中心点--> E步和M步。

· 2E步中将每个点选择最近的类优化目标函数，分给中心距它最近的类(硬分配)，可以看成是EM算法中E步(软分配)的近似。

·3 M步中更新每个类的中心点，可以认为是在「各类分布均为单位方差的高斯分布」的假设下，最大化似然值；

爱学习的影峰

关注

8
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
机器学习算法——EM算法

EM算法是一种迭代算法，分为E、M两步。他就是含有隐变量的概率模型参数的极大似然估计法，或极大后验概率估计法 (将求已知量P（Y|θ）转换为求隐变量P（Y|Z,θ）P（Z|θ）的过程） E步：利用当前估计的参数值，求出在该参数下隐含变量的条件概率值（计算对数似然的期望值）； M步：结合E步求出的隐含变量条件概率，求出似然函数下界函数的最大值（寻找能使E步产生的似然期望最大化...
复制链接

扫一扫

专栏目录

爱学习的影峰 CSDN认证博客专家 CSDN认证企业博客

码龄10年

14: 原创

111万+: 周排名

52万+: 总排名

5万+: 访问

: 等级

632: 积分

8: 粉丝

32: 获赞

3: 评论

111: 收藏

私信

关注

分类专栏

cmake 2篇
C++ 9篇
python 1篇
机器学习 9篇

最新评论

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。