DISC: Density-Based Incremental Clustering by Striding over Streaming Data-CSDN博客

本文链接：https://blog.csdn.net/zj_18706809267/article/details/128038401

随着移动设备和物联网的发展，流数据聚类成为数据分析的关键。文章提出了一种名为DISC的新算法，专门针对滑动窗口模型优化，旨在解决基于密度的聚类算法在处理流数据时的效率问题。DISC在保持聚类质量的同时，能以更快的速度产生与增量DBSCAN等现有方法相当的结果。该算法包括收集和聚类两个步骤，通过核心点的可达性分析处理簇分裂和合并，有效地处理大规模流数据的聚类任务。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

DISC: Density-Based Incremental Clustering by Striding over Streaming Data

随着移动设备和物联网设备的普及，对流数据进行连续聚类已经成为数据分析的重要工具。在众多聚类算法中，基于密度的聚类算法因其独特的优点而受到广泛关注。然而，它的主要缺点是由于相对较高的计算成本而限制了可扩展性，当它必须随着数据的变化不断更新集群时，这一问题进一步恶化。提出了一种新的基于密度的增量聚类算法DISC optimized for sliding window model。DISC能够以更快、更高效的速度产生与现有方法(如针对流数据的增量DBSCAN)完全相同的聚类结果。

主要目标：

针对基于密度的流数据聚类存在的局限性，在不影响聚类结果质量或消耗过多计算资源的前提下，使得流数据的聚类任务能够及时完成。本文提出的基于密度的聚类算法称为基于密度的增量跨步聚类(density-based Incremental Striding Cluster，简称DISC)。它能够以更快、更有效的方式产生与现有方法(如增量DBSCAN)完全相同的聚类结果。

A. Density-Based Clustering