无监督学习之高斯混合模型

最新推荐文章于 2023-08-29 09:09:25 发布

Linky1990

最新推荐文章于 2023-08-29 09:09:25 发布

阅读量887

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/liangjiu2009/article/details/106049716

版权

机器学习专栏收录该内容

18 篇文章 0 订阅

订阅专栏

假设：每个类都服从特定的统计分布

高斯混合模型：一个模型，包含多个高斯分布混合在一起

每个样本都属于现有的类，但是隶属度不同

GMM 期望最大化算法

1、初始化 $k$ 个高斯分布（默认 k-means）

给 $k$ 个高斯分布赋予均值 $\mu$ 和方差 $\sigma^2$

2、软聚类

计算每个点对于每个类的隶属度
$E[Z_1A]=\frac{N(X_i|\mu_A,\sigma_A^2)}{N(X_i|\mu_A,\sigma_A^2)+N(X_i|\mu_B,\sigma_B^2)}$

$N(X|\mu,\sigma^2)=\frac{1}{(2\pi\sigma^2)^2}e^{-\frac{1}{2\sigma^2}(x-\mu)^2}$

样本 $X_i$ 对于类 $A$ 的隶属度为，点 $X_i$ 在类 $A$ 的高斯密度与全部高斯密度之和之间的比率

3、重新估计高斯 - 最大化步骤

聚类 $A$ 新的均值和方差，来自于所有点的 隶属度加权平均数
$\mathrm{new}\mu_A=\frac{\sum_i EX_i}{\sum_i E}$

$\mathrm{new}\sigma^2=\frac{\sum_iE(X_i-\mathrm{new}\mu)(X_i-\mathrm{new}\mu)^T}{\sum_iE}$

$\mu$ 用数据点做加权， $\sigma^2$ 用距离做加权

4、评估对数似然（log likelihood）检查收敛
$\mathrm{ln}p(X|\mu,\sigma^2)=\sum\limits_{i=1}^{N}\mathbb{ln}\big(\sum\limits_{k=1}^{K}\pi_kN(X_i|\mu_k,\sigma_k^2)\big)$

5、repeat 2

sklearn 中使用 GMM

from sklearn import mixture

mixture.GaussianMixture(n_compoments=3).fit(X)

优缺点

优点

1、软聚类，一个样本可以同时属于多个类

2、聚类外观灵活性，一个聚类可以包含另一个聚类

缺点

1、对初始值很敏感

2、有可能收敛到局部最优

3、收敛速度慢

Paper: Nonparametric discovery of human routines from sensor data

Paper: Application of the Gaussian mixture model in pulsar astronomy

Paper: Speaker Verification Using Adapted Gaussian Mixture Models

Paper: Adaptive background mixture models for real-time tracking

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
无监督学习之高斯混合模型

假设：每个类都服从特定的统计分布高斯混合模型：一个模型，包含多个高斯分布混合在一起每个样本都属于现有的类，但是隶属度不同GMM 期望最大化算法1、初始化 kkk 个高斯分布（默认 k-means）给 kkk 个高斯分布赋予均值 μ\muμ 和方差 σ2\sigma^2σ22、软聚类计算每个点对于每个类的隶属度E[Z1A]=N(Xi∣μA,σA2)N(Xi∣μA,σA2)+N(Xi∣μB,σB2)E[Z_1A]=\frac{N(X_i|\mu_A,\sigma_A^2)}{N
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。