![6c77b422535da70e47ebd596310f5d9c.png](https://i-blog.csdnimg.cn/blog_migrate/42dc9bf87aaff75794d2c448b2a698fe.png)
高斯混合模型(Gaussian Mixture Model)是机器学习中一种常用的聚类算法,本文介绍了其原理,并推导了其参数估计的过程。主要参考Christopher M. Bishop的《Pattern Recognition and Machine Learning》。
以粗体小写字母表示向量,粗体大写字母表示矩阵;标量不加粗,大写表示常数。
1. 高斯分布
高斯分布(Gaussian distribution),也称为正态分布(normal distribution),是一种常用的连续变量分布的模型。若单个随机变量
对于一个
其中
(1)式中,指数部分的二次型
2. 高斯混合模型(Gaussian Mixture Model)
多个高斯分布的线性叠加能拟合非常复杂的密度函数;通过足够多的高斯分布叠加,并调节它们的均值,协方差矩阵,以及线性组合的系数,可以精确地逼近任意连续密度([1], Section 2.3.9, p111)。
我们考虑
其中,