“上帝的算法”在高斯混合分布中的应用

最新推荐文章于 2021-12-10 16:14:53 发布

Captain_zp

最新推荐文章于 2021-12-10 16:14:53 发布

阅读量2.3k

点赞数

分类专栏：模式识别、机器学习、数据挖掘、推荐系统模式识别算法详解文章标签：期望最大值化高斯混合分布 EM

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhangping1987/article/details/22724655

版权

模式识别、机器学习、数据挖掘、推荐系统同时被 2 个专栏收录

24 篇文章 3 订阅

订阅专栏

模式识别算法详解

9 篇文章 8 订阅

订阅专栏

吴军老师在《数学之美》中称期望最大值化算法为“上帝的算法”，下面就讨论EM算法在高斯混合分布中的应用。

接高斯判别分析与高斯混合分布之庖丁解牛（第一集）最后剩下的问题继续讨论，以下先不谈什么隐含因子，只是单纯的数学演算，过程非常有意思！

以下的讨论会用到几点知识，我们先作为补充知识，说一下：

补充知识点一：凹函数的定义：

设是定义在上的函数，若对任意的和任意的，如果满足以下条件，

，

则称函数在上是凹函数。

补充知识点二：若函数的二阶导数在上满足，则函数是凹函数。显然就是凹函数。

补充知识点三：jensen不等式：

若函数在上是凹函数，则对任意的,,且，满足

。

___________________________________________________________________________________________

设数据集

是以下高斯混合分布的样本点：

我们接着给出该模型的似然函数的对数：

下面就是对上面对数似然函数的变形，然后引出高斯混合分布:

，

我们只是同乘以一个,接着又除以一个，所以等号成立，其中对任意的，，满足以下条件：

（注意：因为在分母上，我们暂时先考虑的情况。后面引出EM算法时，我们会去掉分母上的。还有演算到这一步，我们发现这个最优化问题，理论上可以通过梯度下降，kuhn-tucker条件等算法求解，但是太困难，这便是EM算法提出的动机）

根据补充知识点二，得出log(x)是凹函数，然后再根据补充知识点三jensen不等式，我们便得到：

，

更有意思的是，当（下面的公式会很眼熟，就是EM算法的E步）

时，等号成立。

E步，推出来了，那么M步就好做了，我不再仔细推了，直接给出M步：

注意：在这一步，我们就把分母上的去掉了。为什么去掉，还有为什么收敛，我就不啰嗦了！迭代步骤示意图：

以上便是“上帝的算法”

————————————————————————————————————————————————————————————————————————————

学习EM算法参考资料：

1.【book】:Pattern Recognition and Machine Learning 第九章，这一章还讨论为什么k-均值聚类算法也是EM算法特例

2.Andrew Ng老师的讲义，及公开课视频教程

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。