K-means 聚类(k聚类)
提前知道:
簇
分类中的类
所以k聚类,就是发现给定数据集中k个簇的算法。(k是用户定义的)
作用(应用领域):
分类。
有无监督
无监督学习
步骤:
- 确定k值,即分类的类别数
- 根据k值,随机选取k个点,作为中心点。分别计算其余各个点到着k个点的距离。对于每一个非中心点,找到离它最近的中心点,并归为一个簇。
- 计算每个簇中所有节点的平均值,作为新的中心点,并重复上述操作,再次计算每个非中心点到新的中心点的距离,找到距离非中心点最近的中心点归为一个簇。
- 如果最后中心点不变,或者簇不再发生变化,就完成了最终的聚类。
优点
简单,易理解。运算速度快
缺点
仅仅可应用于连续的数据
需手工指定分为几类