GMM简介

最新推荐文章于 2022-08-29 10:47:24 发布

火鸡哥

最新推荐文章于 2022-08-29 10:47:24 发布

阅读量4k

点赞数

分类专栏：机器学习非监督学习

本文链接：https://blog.csdn.net/u012587024/article/details/83010150

版权

机器学习同时被 2 个专栏收录

33 篇文章 1 订阅

订阅专栏

非监督学习

5 篇文章 0 订阅

订阅专栏

高斯混合模型(GMM)

无论是k-means、层次聚类还是DBSCAN，聚类后都是有明显的“分界线”的，但如果是两个混合在一起的数据，这些方法就不能很好地聚类了，而GMM却能很好地对这类混合数据进行分类，GMM是利用同类数据呈现高斯分布的原理对数据进行区分的。

1､步骤

第一步：初始化k个高斯分布；

GMM必需的参数，n_components，指定聚类的数量

第二步：将数据软聚类成我们初始化的k个高斯；

初始化高斯分布的均值 $\mu$ 和方差 $\sigma^2$ ，初始化权值、均值和精度的方法有以下两种方法：
第一种方法：随机生成
第二种方法：kmeans（默认）

第三步：软聚类

概率密度函数：
$N(X|\mu,\sigma^2) = \frac{1}{\sqrt{2\pi}\sigma}e^{-\frac{(x-\mu)^2}{2\sigma^2}}$
隶属度：
$E[Z_{1A}] = \frac{N(X_i|\mu_A,\sigma_A^2) }{\sum_{j=1}^{m}N(X_i|\mu_j,\sigma_j^2) }$

第三步：基于软聚类重新估计高斯参数

更新增均值：
$new\mu_A = \frac{\sum_{i=1}^NE[Z_{im}]X_i}{\sum_{i=1}^NE[Z_{im}]}$
更新方差：
$new\sigma^2 = \frac{\sum_{i=1}^NE[Z_{iA}](X_i-new\mu_A)(X_i-new\mu_A)^T}{\sum_{i=1}^NE[Z_{iA}]}$

第四步：评估对数似然来检查收敛

对数似然：
$lnp(X|\mu,\sigma^2) = \sum_{i=1}^Nln(\sum_{k=1}^K\pi_kN(X_i|\mu_k,\sigma_k^2)$

2､sklearn上的GMM

from sklearn import mixture

#n_components:聚类个数
gmm = mixture.GaussianMixture(n_components=3)
gmm.fit(X_train)
clustering = gmm.predict(X_test)

火鸡哥

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
GMM简介

高斯混合模型无论是k-means、层次聚类还是DBSCAN，聚类后都是有明显的“分界线”的，但如果是两个混合在一起的数据，这些方法就不能很好地聚类了，而GMM却能很好地对这类混合数据进行分类，GMM是利用同类数据呈现高斯分布的原理对数据进行区分的。1､步骤第一步：初始化k个高斯分布；GMM必需的参数，n_components，指定聚类的数量第二步：将数据软聚类成我们初始化的k个高斯；...
复制链接

扫一扫