在前一篇文章中,重点讲解了EM的推导过程,但是这里EM只是一个算法思想
比如里面具体的参数θ还需要根据需要参数迭代的具体的模型进行确定。在EM中很重要的一个概念是隐含变量,也就是类别Z,那么在机器学习的算法中很重要的两个模型都是和Z不确定情况下求参数。聚类问题和GMM,其实GMM也是可以看成是类似聚类模型的一个算法。
一 Kmean: http://www.cnblogs.com/jerrylead/archive/2011/04/06/2006910.html
K-means算法是将样本聚类成k个簇(cluster),具体算法描述如下:
1、 随机选取k个聚类质心点(cluster centroids)为。 2、 重复下面过程直到收敛 { |