EM 算法

zhao_crystal

于 2021-11-03 08:43:48 发布

阅读量1.1k

点赞数

分类专栏：算法/ML 文章标签：算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zhao_crystal/article/details/121113515

版权

算法/ML 专栏收录该内容

57 篇文章

订阅专栏

目录

2.最大似然估计

2.1 二项分布的最大似然估计

2.2 最大似然函数做参数估计

3. EM算法：随机变量无法直接（完全）观察到

3.1 欧拉式的解释

3.2 Gauss式的解释

4. GMM的推导

4.1 从直观理解猜测GMM的参数估计

4.2 从理论公式推导GMM

5.EM算法的应用

5.2 模型选择的标准

8.1 二项分布与先验举例

1.概述

经典的K-means聚类方法，能够非常方便的将未标记的样本分成若干簇；但无法给出某个样本属于该簇的后验概率。

EM算法全称：Expectation Maximization Algorithm

2.最大似然估计

找出与样本的分布最接近的概率分布模型。

一个例子：

2.1 二项分布的最大似然估计

2.2 最大似然函数做参数估计

上述结论和矩估计的结果是一致的，并且意义非常直观：样本的均值即高斯分布的均值，样本的伪方差即高斯分布的方差。

3. EM算法：随机变量无法直接（完全）观察到

3.1 欧拉式的解释

3.2 Gauss式的解释

假定有训练集{x1, x2, ……xm},包含m个独立样本，希望从中找到该数组数据的模型p(x,z)的参数（其中：z为隐变量）。

通过最大似然估计得到目标函数

z是隐随机变量，不方便直接找到参数估计。策略：计算l(θ)下界，求该下界的最大值；重复该过程，直到收敛到局部最大值。

4. GMM的推导

4.1 从直观理解猜测GMM的参数估计

4.2 从理论公式推导GMM

高斯分布的方差

5.EM算法的应用

5.1 等值线

5.2 模型选择的标准

6.DPGMM

同理可推到线性回归的目标函数

7. 总结

（1）混合泊松分布，也可以用EM算法

（2）EM算法需假设数据分布，是否可以用EM算法，主要和是否含有隐变量有关。

（3）Gibbs sampling

8. 附录

8.1 二项分布与先验举例

二项分布的最大似然估计

为什么要加上5？

8.2 PLSA模型

8.参考文献

博客等级

码龄9年

180
原创

254
点赞

1375
收藏

645
粉丝

关注

私信

分类专栏

资源 1篇
大数据 6篇
java 2篇
生活 1篇
golang
搜推广 7篇
算法/leetcoode 2篇
理财
面试 1篇
爬虫 2篇
book
Redis 7篇
python 59篇
matlab 4篇
math 4篇
算法/ML 57篇
linux 17篇
virtualenv 1篇
windows操作 8篇
numpy 1篇
通信 4篇
web 5篇
mac 11篇
加密算法 2篇
深度学习 30篇
Docker 3篇

展开全部收起

最新评论

Decimal.quantize
拾拿九稳: 引用「为什么在这里四舍了？」你想说的是“五舍”吧
tensorflow dataset基础之——dataset api的使用
Sincer: 你对 interleave 的理解有误，请参考https://blog.csdn.net/menghuanshen/article/details/104240189
Out-Of-Vocabulary（OOV）的理解
m0_68703577: 说了个屁屁
Decimal.quantize
姜川JC: 讲的真的很仔细，能否结合保留有效数字讲解一下呢？萌新有些搞不懂
tensorflow基础之——tf.feature_column, tf.estimator, pre_estimator
ccut20091767: train_df = pd.read_csv(train_file) train_df 你都read了，还套到dataset？

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。