K-中心点聚类算法(K-Medoide)

K-中心点算法也是一种常用的聚类算法,K-中心点聚类的基本思想和K-Means的思想相同,实质上是对K-means算法的优化和改进。在K-means中,异常数据对其的算法过程会有较大的影响。在K-means算法执行过程中,可以通过随机的方式选择初始质心,也只有初始时通过随机方式产生的质心才是实际需要聚簇集合的中心点,而后面通过不断迭代产生的新的质心很可能并不是在聚簇中的点。如果某些异常点距离质心相对较大时,很可能导致重新计算得到的质心偏离了聚簇的真实中心。

算法步骤:

(1)确定聚类的个数K。

(2)在所有数据集合中选择K个点作为各个聚簇的中心点。

(3)计算其余所有点到K个中心点的距离,并把每个点到K个中心点最短的聚簇作为自己所属的聚簇。

(4)在每个聚簇中按照顺序依次选取点,计算该点到当前聚簇中所有点距离之和,最终距离之和最小的点,则视为新的中心点。

(5)重复(2),(3)步骤,直到各个聚簇的中心点不再改变。

如果以样本数据{A,B,C,D,E,F}为例,期望聚类的K值为2,则步骤如下:

(1)在样本数据中随机选择B、E作为中心点。

(2)如果通过计算得到D,F到B的距离最近,A,C到E的距离最近,则B,D,F为聚簇C1,A,C,E为聚簇C2。

(3)在C1和C2两个聚类集合中,计算一个点到其他店的距离之和的最小值作为新的中心点,假如分别计算出D到C1中其他所有点的距离之和最小,E到C2中其他所有点的距离之和最小。

(4)再以D,E作为聚簇的中心点,重复上述步骤,直到中心点不再改变。

K-中心聚类算法计算的是某点到其它所有点的距离之和最小的点,通过距离之和最短的计算方式可以减少某些孤立数据对聚类过程的影响。从而使得最终效果更接近真实划分,但是由于上述过程的计算量会相对杜宇K-means,大约增加O(n)的计算量,因此一般情况下K-中心算法更加适合小规模数据运算。

  • 47
    点赞
  • 153
    收藏
    觉得还不错? 一键收藏
  • 11
    评论
以下是一个使用MATLAB实现k-medoids聚类算法的示例代码: ```matlab function [index_km, center_km = kmedoids(data, cluster_num) % 随机选取初始聚类中心点 center_indices = randperm(size(data, 1), cluster_num); center_km = data(center_indices, :); % 迭代更新簇的中心点,直到收敛 while true % 分配数据点到最近的中心点所在的簇 dist_matrix = pdist2(data, center_km); [~, index_km = min(dist_matrix, [], 2); % 更新簇的中心点 for i = 1:cluster_num cluster_points = data(index_km == i, :); cost = sum(pdist2(cluster_points, cluster_points), 'all'); [~, min_index = min(sum(pdist2(cluster_points, cluster_points), 2)); center_km(i, :) = cluster_points(min_index, :); end % 判断是否收敛 if old_center_km == center_km break; else old_center_km = center_km; end end end ``` 这是一个简化的k-medoids聚类算法实现。在该算法中,首先随机选取k个初始聚类中心点,然后迭代更新簇的中心点,直到收敛。收敛的条件是中心点不再发生变化。算法过程中,使用欧氏距离作为相似度的评价指标,将每个数据点分配到距离最近的中心点所在的簇中。 请注意,这只是一个示例代码,可能需要根据实际情况进行修改和优化。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [kmeans聚类算法和k-medoids聚类算法 matlab代码](https://blog.csdn.net/weixin_41971010/article/details/119222824)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* [K-means聚类 —— matlab](https://blog.csdn.net/qq_25990967/article/details/122969769)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值