sklearn应用—高斯混合

原文作者:消费金融风控联盟

原文地址:高斯混合模型 

 

一、高斯混合模型 

sklearn.mixture是一个应用高斯混合模型进行非监督学习的包,支持 diagonal,spherical,tied,full 四种协方差矩阵,它对数据进行抽样,并且根据数据估计模型。同时包也提供了相关支持,来帮助用户决定合适的分量数(分量个数)。 (译注:在高斯混合模型中,我们将每一个高斯分布称为一个分量,即 component )

注:

  • diagonal 指每个分量有各自不同对角协方差矩阵
  • spherical 指每个分量有各自不同的简单协方差矩阵
  • tied 指所有分量有相同的标准协方差矩阵
  • full 指每个分量有各自不同的标准协方差矩阵
二分量高斯混合模型:数据点,以及模型的等概率线。

高斯混合模型是一个假设所有的数据点都是生成于一个混合的有限数量的并且未知参数的高斯分布的概率模型。 我们可以将混合模型看作是 k-means 聚类算法的推广,它利用了关于数据的协方差结构以及潜在高斯中心的信息。对应不同的估算策略,Scikit-learn 实现了不同的类来估算高斯混合模型。 详细描述如下:

二、高斯混合 

GaussianMixture对象实现了用来拟合高斯混合模型的期望最大化 (EM) 算法。它还可以为多变量模型绘制置信区间,同时计算 BIC(Bayesian Information Criterion,贝叶斯信息准则)来评估数据中聚类的数量。 GaussianMixture.fit提供了从训练数据中学习高斯混合模型的方法。 
高斯混合模型是一个概率模型,假设所有的数据点都是生成于一个混合的有限数量的并且未知参数的高斯分布。它是k-means聚类算法的推广,利用了数据的协方差结构以及潜在高斯中心的信息。Scikit-learn库提供了不同的类来估算高斯混合模型,其中GaussianMixture对象实现了用来拟合高斯混合模型的期望最大化(EM)算法。它可以为多变量模型绘制置信区间,并计算BIC(贝叶斯信息准则)来评估数据中聚类的数量。通过调用GaussianMixture.fit方法,可以从训练数据中学习高斯混合模型。\[1\] 在使用sklearn机器学习方法对高斯混合模型进行编程练习时,可以使用mixture模块中的GaussianMixture类。通过调用GaussianMixture的fit方法,可以对数据进行拟合,并返回拟合后的均值。例如,可以使用以下代码对数据进行高斯混合模型的拟合: from sklearn import mixture def test_GMM(dataMat, components=3, iter=100, cov_type="full"): clst = mixture.GaussianMixture(n_components=components, max_iter=iter, covariance_type=cov_type) clst.fit(dataMat) predicted_labels = clst.predict(dataMat) return clst.means_, predicted_labels 其中,dataMat是输入的数据矩阵,components是高斯混合模型的分量数,iter是迭代次数,cov_type是协方差类型。函数返回拟合后的均值和预测的标签。\[2\] 在选择高斯混合模型的分量数时,一种高效的方法是利用BIC(贝叶斯信息准则)。BIC可以在近似状态下选择正确的分量数,前提是有大量数据可用,并且假设这些数据实际上是一个混合高斯模型独立同分布生成的。另外,使用变分贝叶斯高斯混合模型可以避免对分量数的选择。\[3\] #### 引用[.reference_title] - *1* *3* [sklearn应用高斯混合](https://blog.csdn.net/sanmi8276/article/details/113820891)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] - *2* [sklearn高斯混合模型](https://blog.csdn.net/chehec2010/article/details/116170822)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值