单个高斯模型
如果我们有一堆数据,其分布属于一个高斯模型,那么有
p(X)=N(x|μ,Σ)=1(2π)m|Σ|‾‾‾‾‾‾‾‾√exp[−12(x−μ)TΣ−1(x−μ)](1.1)
这样子的话,对于单个高斯,我们可以直接对其参数 μ 和 Σ 进行求导,求出对应的参数。
那么现在有一堆数据,其分布如下所示,
那么我们需要用多个高斯对数据的分布进行描述。接下来我们看看多个高斯混合模型.
混合高斯模型
每个GMM由K个Gaussian分布组成,每个高斯分布(Gaussian)称为一个“Component”,这些Component 线性加成在一起就组成了 GMM 的概率密度函数:
p(x)=∑k=1Kp(k)p(x|k)=∑k=1KπkNk(x|μk,Σk)(2.1)
上式中 ∑Kk=1πk=1 ,其中:
Nk(x|μk,Σk)=1(2π)m|Σk|‾‾‾‾‾‾‾‾‾√exp[−12(x−μk)TΣ−1k(x−μk)](2.2)
这边我们的参数可以用 θ⎯⎯ 来表示:
θ⎯⎯={ μ1,μ2...μk,Σ1,Σ2,...,Σk,π1,π2,...,πk}
这边的 πi 表示的是每个高斯分布对数据分布的权重, ∑kiπi=1
那我们如何从分布中取一点吗?我们可以分成两步,首先 πk 的概率选择一个component(每个component就是一个聚类中心)&#x