学习笔记之高斯混合模型(GMM)梳理

本文详细介绍了高斯混合模型(GMM)的概念,包括先验概率、极大似然估计、后验概率和条件概率。GMM是一种混合模型,由多个高斯分布组成,常用于数据聚类。通过EM(期望最大化)算法进行参数估计,通过E步计算后验概率,M步更新参数,不断迭代直至收敛。文章还涉及Jensen不等式在优化过程中的应用。
摘要由CSDN通过智能技术生成

一、概念解释:

先验概率:在有一定量数据的前提下,我们对参数进行概率估计,事件发生前的预判概率。

极大似然估计:找到一组参数使得我们观测到的数据出现的概率最大。

后验概率:在最合适的那个参数的前提下,观测数据出现的最大概率。

条件概率:P(A|B)=\frac{P(A\cap B)}{P(B)}=\frac{P(A)P(B|A)}{P(B)}

高斯分布:x\sim N(\mu ,\sigma ^{2}),概率密度函数f(x)=\frac{1}{\sigma \sqrt{2\pi }}e^{\frac{-(x-\mu )^{2}}{2\sigma ^{2}}}

高斯混合模型(GMM):高斯混合模型是一种混合模型,混合的基本分布是高斯分布,假设有随机变量x,则高斯混合模型可以表示为:p(x)=\sum_{k=1}^{k=K}\pi _{k}N(x|\mu _{k},\sigma _{_{k}}),其中高斯分布N(x|\mu _{k},\sigma _{_{k}})称为高斯混合模型的第k个分量(component),\pi _{k}相当于每个分量N(x|\mu _{k},\sigma _{_{k}})的权重且满足\sum_{k=1}^{k=K}\pi _{k}=1

密度估计:根据数据来推断概率密度通常被称作密度估计(density estimation)。

参数估计:已知概率密度函数的形式,而要估计其中的参数的过程。

二、GMM理论

  GMM常用于聚类,如果要从一个GMM的分布中随机取一个点的话,实际上可以分为两步:

       1. 随机在K个分量中选一个,每个分量实际被选到的概率就是它的权重,即\pi _{k}

       2. 选中分量之后,单独再这个分两种考虑所选点的概率,此时转化为普通的高斯分布问题。

当确定高斯混合分布的分量个数即K时,之后要做的就是参数估计的过程。假设有N个数据点,我们需要确定的参数有\pi _{k}\mu _{k}

  • 1
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 高斯混合模型GMM)聚类是一种机器学习方法,它是将据集分成多个高斯分布的集合的过程。MATLAB中有一个专门用于GMM聚类的函gmdistribution,可以用来确定据集中存在的高斯分布的量。通过使用该函,可以将据集分成不同的聚类。当然,可以使用其他聚类方法,例如K均值聚类,但GMM聚类具有以下优点: 1. 在确定聚类的量时更加灵活,因为可以使用概率模型来估计每个聚类的权重。 2. 可以处理非球形簇,这是K均值聚类无法处理的。 3. 可以估计聚类的不确定性。 为了使用gmdistribution函进行聚类,需要将待聚类的据集作为参传递给函。还必须指定每个高斯分布的量。最后,gmdistribution函需要一个初始值矩阵来初始化每个高斯分布。可以选择从据集中选取初始值,也可以使用一组随机值来初始化。在运行gmdistribution函后,将返回一个包含据点所属聚类的向量。可以使用这些向量来进一步分析和可视化据。 总之,GMM聚类是一种有用的机器学习技术,可用于将据集分成不同的聚类。MATLAB中的gmdistribution函可帮助用户确定聚类的量和每个高斯分布的初始值,聚类之后可以进一步分析和可视化据点。 ### 回答2: 高斯混合模型GMM)是一种基于概率分布建立的聚类方法。它假设每个聚类都可以用多个高斯分布来拟合,而这些高斯分布的加权和就形成了整个据集的概率密度函。Matlab提供了GMM聚类算法的实现,可以方便地进行聚类操作。 在Matlab中,通过调用gmdistribution函可以建立一个GMM模型,并用据集进行初始化。该函的参包括聚类目、协方差类型、初始化方式等。在得到GMM模型后,可以使用fit函据集进行拟合。fit函会返回每个据点属于每个聚类的概率值。 在对据进行聚类后,可以使用gmdistribution对象的其他函进行分析和可视化,如pdf函可以计算某个点属于每个聚类的概率密度值,cluster函可以给出据集中每个点所属的聚类,plot函可以绘制聚类的概率密度函。此外,Matlab还提供了一些有关GMM的其他函,如gmdistribution.fit和gmdistribution.random,可以用来生成满足GMM模型的据集和对新据进行预测。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值