期望最大化算法在进行聚类时,是将数据集看作一个含有隐性变量的概率模型,然后实现模型最优化,反复迭代进行参数估计,找到与数据本身最契合的最优聚类方式,同时给出最优类别数k。
1 在R中实现期望最大化聚类的是mclust软件包中的核心函数Mclust()。其基本格式为:
Mclust(data, G = NULL, modelNames = NULL, prior = NULL, control = emControl(), initialization = NULL, warn = mclust.options("warn"), x = NULL, verbose = interactive(), ...)
其中,data表示待聚类数据集,G为预设类别数,默认值 为1到9,由软件根据BIC值在这些默认值中选择最优解;moldelNames表示模型类别,软件会自动选择最优的参数值。
首先要安装和加载软件包:
install.packages("mclust")
library(mclust)
2 读取数据集。
Tourism_shares=re