Enhanced soft subspace clustering integrating within-cluster and between-cluster information

最新推荐文章于 2022-08-19 11:06:00 发布

空字符（公众号：月来客栈）

最新推荐文章于 2022-08-19 11:06:00 发布

阅读量800

点赞数 1

分类专栏：论文

本文链接：https://blog.csdn.net/The_lastest/article/details/80166208

版权

ESSC算法是一种聚类方法，旨在最小化簇内距离的同时最大化簇间距离，通过调整超参数η来平衡两者。目标函数结合了传统的K-means思想和簇间距离，以提升聚类效果。算法包括目标函数定义、迭代求解和实际实现，其中分配矩阵引入了模糊指数以适应不同归属程度。

摘要由CSDN通过智能技术生成

1. 聚类的基本思想

再介绍下面这篇论文之前，我们先来回顾一下聚类算法的核心思想。其核心主要是让聚类后的各个簇“离得尽可能远”，这样就能最大程度上使得聚类的准确度最高。那么现在的问题就是我们应该如何来量化“离得尽可能远”呢？或者什么叫“离得尽可能远”，怎么来刻画？

我们都知道传统Kmeans算法仅仅只是最小化簇内距离（先计算每个簇中，每个样本点到其簇中心距离和 $S_1,S_2,\cdots,S_k$ ;再计算 $S=S_1+S_2\cdots S_k$ ，其中最小化 $S$ 就是Kmeans的思想）。我们可以看到它并没有考虑簇间距离，但从直觉上来说，最小化簇内距离，并且同时让各个簇“离得尽可能远”，这样将会使得聚类效果更好。所以，下面这篇文章的主要思想就是： 最小化簇内距离，同时最大化簇间距离（“离得尽可能远”)