利用轮廓系数判断k均值聚类的个数
1、kmeans聚类处理的数据必须是数值型numeric,并且必须是matrxi或者data frame
2、轮廓系数可以使用 fpc包
3、聚类效果没有特殊的评价标准,聚类的个数可以采用这个来判定。
4、聚类个数的其它方法
亦可采用分层聚类方法,从图形结果划分的类别hclust(见最后)
library(fpc)
data <- iris[,1:4]
# 定义存放轮廓系数的向量
re<-c()
for(i in2:5) {
result <- kmeans(data, i)
stats <- cluster.stats(dist(data), result$cluster)
re[i]<- stats$avg.silwidth
};
re
final <- which.max(re) #