白话机器学习算法（十一） GMM

最新推荐文章于 2024-04-19 10:23:42 发布

jiabiao1602

最新推荐文章于 2024-04-19 10:23:42 发布

阅读量738

点赞数

分类专栏：数据挖掘算法

数据挖掘算法专栏收录该内容

25 篇文章 0 订阅

订阅专栏

http://blog.csdn.net/wangxin110000/article/details/22524075

GMM就是高斯混合模型，用GMM去聚类的话，就变成了一个似然估计的问题，估计的参数就是选取每个高斯部件的概率，每个高斯各自的均值方差；

我们可以把实际数据看做由这个GMM随机数生成器产生的，N个数据就是N个观测值，数据之间独立；

根据数据找出这个模型的参数，有了模型参数，我就能简单的算出数据属于哪个高斯部件的概率最大，论文中一般都说responsibility，所以用高斯混合模型来聚类，实质就是一个参数估计问题，EM算法就是专门干这个的；

HMM也是一个参数估计问题，而且HMM跟GMM有很大的相似；

总的来说，基于概率的聚类用到的就是两个东西 MAP（比如贝叶斯） MLE（这个就很多了，GMM GTM都是这样的）,；其他的还有ME（最大熵），ICA的一种方法就是基于最大熵模型得出统计独立的各个分量；

关于EM算法，以后专门详细讨论 .

如果将GMM稍微推广下，加上一点约束，就是假定这些高斯中心位于高维空间的一个流形上，就可以把这些高斯中心映射到一个低维隐空间，我就可以将实际的数据通过后验概率映射到那个隐空间坐标上，实现数据降维，或者数据可视化，这就是GTM算法，这个算法可以在低维空间保持数据的拓扑有序，但是这个保证需要实际数据满足上面的那个假设，就是假定这些高斯中心位于高维空间的一个流形上，隐空间的维度是这个流形的本质维度才行，如果不满足，就不能完全保证这些数据的拓扑有序；

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
白话机器学习算法（十一） GMM

http://blog.csdn.net/wangxin110000/article/details/22524075GMM就是高斯混合模型，用GMM去聚类的话，就变成了一个似然估计的问题，估计的参数就是选取每个高斯部件的概率，每个高斯各自的均值方差；我们可以把实际数据看做由这个GMM随机数生成器产生的，N个数据就是N个观测值，数据之间独立；根据数据找出这个模型的参
复制链接

扫一扫

专栏目录

jiabiao1602 CSDN认证博客专家 CSDN认证企业博客

码龄15年

65: 原创

2万+: 周排名

5852: 总排名

84万+: 访问

: 等级

6974: 积分

456: 粉丝

311: 获赞

66: 评论

1460: 收藏

私信

关注

热门文章

分类专栏

最新评论

R语言：SMOTE - Supersampling Rare Events in R:用R对非平衡数据的处理方法
weixin_68381726: 运行到hyper<-replaceNAWithMean（hyper）报错了，Warning message: In mean.default(x[!is.na(x)]) : 参数不是数值也不是逻辑值：回覆NA 作者知道是怎么回事吗
R语言建立回归分析，并利用VIF查看共线性问题的例子
cyf123_: 您好，我用R语言中逐步回归（后退和步进都试了），做完后用VIF检验各变量为什么还是有共线性大于10的3个变量（年平均温度，年平均降水量和湿润指数），但是用SPSS就不会有这种情况。另外想请教一下R做逐步回归不会自动删除空值吗？会报错“Error in stepAIC(fit1, direction = "backward", na.action = na.omit) : number of rows in use has changed: remove missing values?”。期待您的回复，谢谢您
R在银行财务数据分析中的应用
m0_69770476: 求数据，谢谢
用gbm包来提升决策树能力
qq_28720457: 请问，如何参看样本内R方和样本外R方呢？
用gbm包来提升决策树能力
weixin_52304880: 您好，请问一下解释变量的重要程度一定要从best.iter来吗？而best.iter一定要从cv.fold来吗？因为我只要加了cv.fold，R就会停止运行，然后出现炸弹图标，如果删掉cv.fold就不会出现这个情况，但是我希望保留

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。