目录
1 与Kmeans最大的区别是
与Kmeans最大的区别是:Kmeans的聚类中心是聚类的质心,这个质心一般不会对应数据中的实体点;而Kmedoids聚类的聚类中心是切实地对应着数据中的某个实体点。
如下图中,红色圆圈表示kmedoids的聚类中心,红色菱形表示Kmeans的聚类中心
2 Kmedoids聚类的原理
确定聚类数目 n 后,kmedoids聚类的过程分为以下几步:
- 从数据中随机选择 n 个数据点,计算剩余点的每个点距离这选中的 n 个点中的哪个点最近,就将该点分到最近的聚类中心点
- 计算当前聚类的成本,将其记录为最优成本
- 再从数据中随机选择 n 个数据点,计算剩余点的每个点距离这选中的 n 个点中的哪个点最近,就将该点分到最近的聚类中心点
- 计算当前聚类的成本,
- 如果比最优成本好,就更新聚类结果;
- 如果连续连续两次聚类结果不变,则停止,输出聚类结果;否则,回到第3步
详细的计算过程:
- 第一步: 计算距离矩阵,是为