聚类算法,属于无监督学习
K-Means算法
K-Means算法的目标,是把n个样本点划分到k个类中,使得每个点都属于离它最近的质心对应的类,以之作为聚类的标准。
质心:
指一个类,内部所有样本点的均值。
kmeans(x,centers)
- x 待聚类的训练样本
- centers 聚类的个数,也就是要分成多少类
代码实现:
pColumns <- c('Sepal.Length', 'Sepal.Width', 'Petal.Length', 'Petal.Width');
plot(iris[, c("Sepal.Length", "Sepal.Width")])
#分类模型训练
kmc <- kmeans(iris[, pColumns], 3);
table(iris$Species, kmc$cluster); #查看分类概括