K-means聚类大致思想可以通俗地理解成这样:
K-Means 聚类算法的大致思想就是“物以类聚,人以群分”:
1、首先输入 k 的值,即我们指定希望通过聚类得到 k 个分组;
2、从数据集中随机选取 k 个数据点作为初始大佬(质心);
3、对集合中每一个小弟,计算与每一个大佬的距离,离哪个大佬距离近,就跟定哪个大佬;这时每一个大佬手下都聚集了一票小弟,这时候召开选举大会,每一群选出新的大佬(即通过算法选出新的质心);常见的算法就是:新的点到所有的质点的距离平方和最小,那它就是新的大佬。
4、如果新大佬和老大佬之间的距离小于某一个设置的阈值(表示重新计算的质心的位置变化不大,趋于稳定,或者说收敛),可以认为我们进行的聚类已经达到期望的结果,算法终止;
5、如果新大佬和老大佬距离变化很大,需要迭代3~5步骤。
参考: