机器学习——EM算法知识点与面试总结

阿拉灯神阿丁

于 2017-07-12 20:09:13 发布

阅读量7.3k

点赞数

分类专栏：机器学习文章标签：机器学习 EM 迭代

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34896915/article/details/75040578

版权

EM算法是一种用于含有隐变量的概率模型参数极大似然估计的迭代算法，包括E步和M步。E步计算隐变量条件概率的期望值，M步则寻找使似然函数增大的参数。EM算法在高斯混合模型、协同过滤和k-means中有应用，但对初始值敏感，可能收敛到局部最优解。相比于牛顿法或梯度下降，EM算法更适合处理隐变量多的情况。

摘要由CSDN通过智能技术生成

提出：有时候任务中含有一些不能观察到的隐含变量，样本的产生和隐含变量有关，而求模型的参数时一般用最大似然估计，由于隐变量的存在，所以对似然函数参数求导是求不出来的，这时采用EM算法来求导。

总结：是一种迭代算法，用于含有隐变量的概率模型参数的极大似然估计。两个步骤交替计算：

E步：利用当前估计的参数值，求出在该参数下隐含变量的条件概率值（计算对数似然的期望值）；

M步：结合E步求出的隐含变量条件概率，求出似然函数下界函数的最大值（寻找能使E步产生的似然期望最大化的参数值。）然后，新得到的参数值重新被用于E步.....直到收敛到局部最优解。（note：每次迭代实际在求Q函数及其极大，即每次迭代使似然函数增大或达到局部极值。）

通俗来讲：就是对于一个含有隐变量的概率模型，目标是极大化观测数据Y关于参数theta的对数似然函数。

优点：简单性和普适性，可看作是一种非梯度优化方法（解决梯度下降等优化方法的缺陷：求和的项数将随着隐变量的数目以指数级上升，会给梯度计算带来麻烦）

最低0.47元/天解锁文章

阿拉灯神阿丁

关注

0
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
机器学习——EM算法知识点与面试总结

提出：有时候任务中含有一些不能观察到的隐含变量，样本的产生和隐含变量有关，而求模型的参数时一般用最大似然估计，由于隐变量的存在，所以对似然函数参数求导是求不出来的，这时采用EM算法来求导。总结：是一种迭代算法，用于含有隐变量的概率模型参数的极大似然估计。两个步骤交替计算：E步：利用当前估计的参数值，求出在该参数下隐含变量的条件概率值（计算对数似然的期望值）；M步：结合E步求出的隐含变量
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。