几种聚类算法的结合运用(K-MEANS K-medoids 最大最小距离算法)

最新推荐文章于 2021-05-23 13:34:49 发布

Biggie-J

最新推荐文章于 2021-05-23 13:34:49 发布

阅读量6.6k

点赞数

分类专栏：算法文章标签：几种聚类算法的结合运用 K-MEANS K-medoids 最大最小距离算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jyxjyx27/article/details/42647463

版权

本文探讨了聚类算法的结合使用，包括K-MEANS、K-medoids和最大最小距离算法。通过最大最小距离算法选择初始聚类中心以克服K-MEANS的不足，然后利用K-medoids更新聚类中心，确保聚类效果。整个过程以降低聚类间节点代价和为目标，最后按代价高低对聚类排序。

摘要由CSDN通过智能技术生成

几种聚类算法的结合运用（K-MEANS、 K-medoids、最大最小距离算法）

聚类算法通常会得到一种分类，将n个点聚合成k类，同一聚类（即插槽簇）中的对象相似度较高；而不同类中的对象相似度较小。

聚类算法的基本流程如下：

（1）从n个节点中选择 k 个节点作为初始聚类中心。（2）将剩余节点根据它们与这k个聚类中心的代价大小，分别将它们分配给与其代价最小的（聚类中心所代表的）聚类。（3）更新聚类的聚类中心。不断重复（2）（3）这一过程将剩下其它节点分配完毕。（4）排序，将各聚类按照聚类间节点代价和高低降序排列。

下面详细解释上述步骤。

（1）从n个节点中选择 k 个节点作为初始聚类中心

由于K-MEANS算法（一种典型的聚类算法，随机确定k个聚类中心）有缺点：产生类的大小相差不会很大，对于脏数据很敏感。所以采用最大最小距离算法确定这k个聚类中心。最大最小距离算法是识别领域中的一种试探性算法。思想是取尽可能离得远的对象作为聚类中心，以避免聚类中心过于邻近。

步骤如下：

1.计算各节点到其他节点的最大代价总和，取满足最大的点i（可理解为距其他节点最远）为聚类1的中心点。

2.计算其他节点到点的最大代价，取满足最大的i点为聚类2的中心点。

3. 计算其他节点到、点的最大代价，取满足最大的i点为聚类3的中心点。

4. 计算其他节点到、、点的最大代价，取满足最大的i点为聚类4的中心点。

以此类推直到找到k个聚类中心点。

（2）将剩余节点根据它们与这些聚类中心的代价大小，分别将它们分配给与其代价最小的（聚类中心所代表的）聚类

依次将不是聚类中心点的节点分配到k个聚类中去。若某类中已经有两个节点，则在分配进入该节点之后还要进行更新聚类中心点的操作（见后（3）详解）。

（3）更新聚类的聚类中心

当某个聚类中存在3个或3个以上节点时需要更新此聚类中心点。采用K-medoids算法中的更新聚类中心方式。在 K-medoids算法中，我们将从当前聚类中选取这样一个点——它到其他所有（当前聚类中）点的代价之和最小——作为中心点。

（4）排序，将各

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。