十一、高斯混合模型（Gaussian Mixed Model, GMM）

最新推荐文章于 2024-06-28 09:44:04 发布

cute_Lily

最新推荐文章于 2024-06-28 09:44:04 发布

阅读量4.1k

点赞数 2

分类专栏：机器学习

本文链接：https://blog.csdn.net/coffee_cream/article/details/109469199

版权

本文介绍了高斯模型及其混合模型的概念，详细讲解了单高斯模型和高斯混合模型的数学表达式。此外，文章探讨了高斯混合模型与EM算法的关系，解释了EM算法在求解高斯混合模型中的基本思想和求解过程。最后，文章对比了GMM和K-means算法的异同点。

摘要由CSDN通过智能技术生成

1 高斯模型

1.1 单高斯模型

当样本数据 $X$ 是一维数据时， $X$ 服从高斯分布是指其概率密度函数（Probability Density Function）可以用下面的式子表示：

$P(x|\theta)=\frac{1}{\sqrt{2\pi} \sigma} \exp (-\frac{(x-\mu)^2}{2\sigma^2})$

其中， $\mu$ 为数据均值（期望）， $\sigma$ 为数据标准差（Standard Deviation）。

当样本数据 $X$ 是多维数据时， $X$ 服从高斯分布是指其概率密度函数（Probability Density Function）可以用下面的式子表示：

$P(x|\theta)=\frac{1}{(2\pi)^{\frac{D}{2}} |\Sigma|^{\frac{1}{2}}} \exp (-\frac{(x-\mu)^T \Sigma^{-1} (x-\mu)}{2})$

其中， $\mu$ 为数据均值（期望）， $\sigma$ 为数据标准差（Standard Deviation）， $D$ 为数据维度。

1.2 高斯模型混合模型

高斯混合模型可以看做是由 $K$ 个单高斯模型组合而成的模型，其定义为：

高斯混合模型是指具有如下形式的概率分布模型：
$P(x|\theta)=\sum_{k=1}^{K}\alpha_k \phi(x|\theta_k)$
其中， $\alpha_k$ 是系数， $\alpha_k \geq 0$ ， $\sum_{k=1}^{K}\alpha_k=1$ ， $\phi(x|\theta_k)$ 是高斯分布， $\theta_k=(\mu_k,\Sigma_k^2)$
$\phi(x|\theta_k)=\frac{1}{(2\pi)^{\frac{D}{2}} |\Sigma_k|^{\frac{1}{2}}} \exp (-\frac{(x-\mu_k)^T \Sigma_k^{-1} (x-\mu_k)}{2})$
称为第 $k$ 个分模型

高斯混合模型是一个生成式模型，可以这样理解数据的生成过程：假设一个最简单的情况，即只有两个一维标准高斯分布的分模型 $N (0, 1)$ 和 $N (2, 1)$ ，这两个分布的权重分别为 0.7 和 0.3，那么在生成一个数据点时，先按照 0.7 和 0.3 的概率随机选择一个分布，比如选择的是第一个分布 $N (0, 1)$ ，那么下一步就是按照 $N (0, 1)$ 生成一个数据点。每一个点的生成过程都是互相独立的，不断循环，就生成了所有的数据点。

2 高斯混合模型与 EM 算法

2.1 基本思想

高斯混合模型的核心思想是： 假设数据可以看作是从多个高斯分布中生成出来的，在该假设下，每个单独的分模型都是标准高斯模型，其均值 $\mu_k$ 和方差 $\sigma_k$ 是待估计的参数，每个分模型还有一个需要求解的参数 $\alpha_k$ ，可以理解为该分布的权重或生成数据的概率。

通常，高斯混合模型的求解是在给定一系列数据点的情况下，求得最佳的 $K$ 个高斯分模型。因为问题的本质，是求解最佳的均值 $\mu$ 、方差 $\sigma$ 和权重 $\alpha$ ，这类问题通常是用最大似然估计来求解的，但在这里，如果直接用最大似然估计，得到的是一个复杂的非凸函数，目标函数是和的对数，难以展开和求偏导。