1.原理
k-mediods聚类算法原理和k-means聚类算法原理大体相似,主要不同的是k-means聚类算法更新聚簇中心的时候直接计算的均值,而k-mediods聚类算法更新聚簇中心的时候先对每个聚簇中心计算每一个点到簇内其他点的距离之和,然后再选择距离最小的点来作为新的聚簇中心。k-mediods算法这样计算可以避免数据中的异常值带来的影响。
2.算法思路
(1)从输入的样本中随机选择一个样本作为第一个聚类中心(初始的聚类中心之间的相互距离应该尽可能大)
(2)计算每一个样本到各个中心点的距离,选择距离最小的中心点,把该样本归到该类别。
(3)当所有样本都划归完了后,计算每一个点到簇内其他点的距离之和,然后再选择距离最小的点来作为新的聚簇中心。
(4)重复(2)(3)步,直到聚类中心不再变化位置。