1.原理解析:
它将数据集看作一个含有隐性变量的概率模型,并以实现模型最优化,即获取与数据本身性质最契合的聚类方式为目的,通过”反复估计”模型参数找到最优解,同时给出相应的最优类别k.而”反复估计”的过程即是EM算法的精华所在,这一过程由E-step(Expectation)和M-step(Maximization)两个步骤交替进行来实现。
2.在R语言中的应用
期望最大化聚类主要运用到了mclust包里的Mclust函数。
Mclust(data,G=NULL,modelNames=NULL,prior=NULL,control=emControl(),initialization=NULL,warn=FALSE,…)
3.以iris数据集为例进行分析
1)应用模型并查看模型的相应参数
fit_EM=Mclust(iris[,-5])
fit_EM[1:length(fit_EM)]
R语言聚类算法之期望最大化聚类(Expectation Maximization Algorithm)
最新推荐文章于 2024-09-28 13:56:01 发布