Discrete and Balanced Spectral Clustering With Scalability
离散且平衡的谱聚类算法:一种可扩展的方法
Rong Wang , Huimin Chen , Yihang Lu , Qianrong Zhang, Feiping Nie , and Xuelong Li
摘要
谱聚类(SC)因其卓越的聚类性能而成为深入研究的主要课题。尽管取得了成功,但大多数现有的SC方法存在几个关键问题。首先,它们通常涉及两个独立阶段,即学习连续松弛矩阵,然后对聚类指示矩阵进行离散化。这种两阶段方法可能导致次优解,对聚类性能产生负面影响。第二,这些方法很难维持许多现实世界数据中固有的聚类平衡属性,这限制了它们的实际适用性。最后,这些方法在计算上很昂贵,因此无法处理大规模数据集。针对这些限制,我们提出了一种新颖的离散且平衡的谱聚类模型(DBSC),该模型将学习连续松弛矩阵和离散聚类指示矩阵整合为一个步骤。此外,所提出的模型还保持每个聚类的大小大致相等,从而实现软平衡聚类。更重要的是,DBSC模型结合了基于锚点的策略,以提高其对大规模