高斯混合模型(GMM)原理

GMM(高斯混合模型主要用于聚类)

(1)某样本点x_i在GMM上的概率为:

                                                                          P(x_i)=\sum_{k=1}^{K}\pi _kP(x_i|k)

其中,GMM由K个单GM构成:\pi_k表示第k个GM的权重;P(x_i|k)为该样本在第k个GM(其均值为\mu _k,方差为\sigma _k)的概率。

则所有的N个样本点在GMM上的概率为:

                                                   P(X)=P(x_1,x_2,...x_N)=\prod_{i=1}^{N}P(x_i)=\prod_{i=1}^{N}\left [ \sum_{k=1}^{K}\pi_kP(x_i|k) \right ]

采用对数形式,则得到其似然函数:

                                                logP(X)=log\prod_{i=1}^{N}\left [ \sum_{k=1}^{K}\pi_kP(x_i|k) \right ]=\sum_{i=1}^{N}log\left [ \sum_{k=1}^{K}\pi_kP(x_i|k) \right ]

我们的目标是:最大化logP(X),使所有样本在高斯混合模型GMM上的概率最大。其中,P(x_i|k)又可以表示为N(x_i|\mu_k,\sigma _k )

(2) 第i个样本x_i由第k个GM模型生成的概率为:

                                                               P(x_i|k)=\frac{\pi_kN(x_i;\mu_k,\sigma_k)}{\sum_{k=1}^{K}{\pi_kN(x_i;\mu_k,\sigma_k)}}

其中,分子表示样本x_i由第k个模型生成的概率,分母表示样本x_i由所有模型生成的概率。

(3) 第k个GM模型的均值,由在该模型上的所有样本数据共同决定:

                                                                       \mu_k=\frac{\sum_{i=1}^{N}P(x_i|k)x_i}{\sum_{i=1}^{N}P(x_i|k)}

同理,我们可以得到:

                                                     \sigma _k=\frac{\sum_{i=1}^{N}P(x_i|k)(x_i-\mu_k)(x_i-\mu_k)^T}{\sum_{i=1}^{N}P(x_i|k)}

                                                                          \pi_k=\frac{1}{N}\sum_{i=1}^{N}P(x_i|k)

(4)我们将(3)中求得的\mu_k,\sigma_k,\pi_k代入logP(X),考察是否与上一轮参数构成的logP(X)相收敛(即差值小于一定的阈值);若不收敛,则继续进行(2)(3)步进行迭代操作,直至收敛。当logP(x)收敛时:对于样本x_i,在(2)中计算出它在各GM中的生成概率,则该样本服从最大生成概率的那个GM。

注:初始时的P(x_i|k),可以对\mu_k,\sigma_k,\pi_k进行随机赋值得到。

参考:

http://www.cnblogs.com/CBDoctor/archive/2011/11/06/2236286.html

http://blog.sina.com.cn/s/blog_54d460e40101ec00.html

http://blog.csdn.net/crzy_sparrow/article/details/7413019

  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值