GMM高斯混合模型 学习(2)

(图片from http://www.cnblogs.com/zhangchaoyang/articles/2624882.html)

如果x是二维的,那么上述公式为:

=cov(x0,x1),是x1和x0的协方差。

一元高斯到多元高斯的发展推导:

参考:https://www.zhihu.com/question/36339816/answer/385944057

单高斯分布

如果特征x是一维(只考虑点的x坐标)的,高斯分布是:(from这篇博客

如果特征是二维(x坐标和y坐标,意义可以是身高和体重)的,聚类的效果应该是:

在上面两张图中,我们用EM—GMM算法做聚类,用的是单个高斯函数描述一个类别(男一个,女一个)。

如用一维高斯描述了男生和女生的身高分布。

高斯混合分布

但是如果统计的这些身高同时有荷兰人(高)和刚果人(矮),这个单高斯模型会出什么问题?

显然用一个高斯分布来描述男女身高是不行了,这样就需要混合高斯模型,如:

【π表示各种人(荷兰男人、荷兰女人、刚果男人、刚果女人)所占的比例】

现在有一批男人身高数据(荷兰男人+刚果男人),我们可以参照这篇博客的EM方法得到

同理,可以得到女人身高的双高斯分布。

这样,用混合双高斯分布来判断 “荷兰美眉” 的性别就对了。【即将“荷兰美眉”的特征向量X带入Gm和Gf求概率】

混合高斯模型GuassMixtureModel

如果这时候中国人、美国人也混入这批身高数据,二维的高斯模型将不足以刻画数据分布,需要考虑使用4高斯混合分布。

当GMM中的高斯分布越多,对数据的刻画将越细致(当然需要的训练数据就更多,计算量也会更大)。

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值