通常采用EM对GMM参数进行估计。EM(期望值最大,Expectation Maximum)算法思想比较简单,主要分为两个步骤,估计步骤E-step和最大化步骤M-step。首先利用样本对参数进行估计,然后在M-step中将需要估计的参数最大化(通常是求其最大似然估计),不断地迭代此两个步骤,直到收敛。
下面写一下采用EM估计GMM的步骤:
1、初始值确定。
方案1:将协方差矩阵设为单位矩阵,每个模型的先验概率设为1/M,均值设为随机数,即:
方案2:有k均值(k-mean)聚类算法对样本进行聚类,利用各类的均值作为均值初始值,并计算协方差矩阵作为初始值,每个模型的先验概率取各类样本占样本总数的比例。
2、估计步骤(E-step)