原文作者:消费金融风控联盟
原文地址:高斯混合模型
一、高斯混合模型
sklearn.mixture是一个应用高斯混合模型进行非监督学习的包,支持 diagonal,spherical,tied,full 四种协方差矩阵,它对数据进行抽样,并且根据数据估计模型。同时包也提供了相关支持,来帮助用户决定合适的分量数(分量个数)。 (译注:在高斯混合模型中,我们将每一个高斯分布称为一个分量,即 component )
注:
- diagonal 指每个分量有各自不同对角协方差矩阵
- spherical 指每个分量有各自不同的简单协方差矩阵
- tied 指所有分量有相同的标准协方差矩阵
- full 指每个分量有各自不同的标准协方差矩阵
高斯混合模型是一个假设所有的数据点都是生成于一个混合的有限数量的并且未知参数的高斯分布的概率模型。 我们可以将混合模型看作是 k-means 聚类算法的推广,它利用了关于数据的协方差结构以及潜在高斯中心的信息。对应不同的估算策略,Scikit-learn 实现了不同的类来估算高斯混合模型。 详细描述如下:
二、高斯混合
GaussianMixture对象实现了用来拟合高斯混合模型的期望最大化 (EM) 算法。它还可以为多变量模型绘制置信区间,同时计算 BIC(Bayesian Information Criterion,贝叶斯信息准则)来评估数据中聚类的数量。 GaussianMixture.fit提供了从训练数据中学习高斯混合模型的方法。