流聚类之DenStream


前言

前文在 流聚类之CluStream 中介绍了CluStream算法的相关内容,本文简单总结了有关流聚类算法DenStream的相关知识,从算法提出的目的以及两阶段过程进行阐述。


一、DenStream 算法提出的目的

对Clustream算法进行改进,引入了时间衰减函数来对不同时间的数据点进行加权;

二、DenStream的两阶段

2.1 在线阶段

➢维护P微簇以及O微簇(存放在一个单独的内存空间中-离群值缓冲区);

➢首先根据DBSCAN算法初始化生成P微簇,当新的数据点到来时,试图将数据点合并到其最近的P微簇中;

➢否则,将数据点合并到其最近的O微簇中,之后检查该O微簇的权重,是否高于阈值,若高于阈值,将其从缓冲区移除成为一个新P微簇;

➢否则,将其创造为一个新的O微簇并放入缓冲区中。

➢对于现在的P微簇,如果迟迟没有数据点加入到其中,该簇的权重会逐渐衰减,如果权重低于阈值,该簇会被删除。DenStream算法会定期检查P/O微簇的权重,若O微簇的权重低于成为O微簇的下限,也会将不符合条件的微簇删除。

2.2 离线阶段

得到用户的请求,对已有的P微簇进行聚类从而得到最终的聚类结果;


总结

  前文在 流聚类之CluStream 中介绍了CluStream算法的相关内容,本文简单总结了有关流聚类算法DenStream的相关知识,从算法提出的目的以及两阶段过程进行了阐述,如果有不足之处或者表述不当的地方欢迎大家指正

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
DenStream是密度聚类算法的一种实现,它可以被用来检测时间序列数据中的离群点或聚类DenStream借鉴了DBSCAN算法的思想,根据密度可达的数据点构建聚类DenStream可以自适应的调整聚类的数量和大小,可以在数据上高效的进行操作。 DenStream的实现可以分为三个部分:聚类构建、聚类融合、聚类合并。 聚类构建部分是最重要的一步,它关注于处理数据点并构建均值漂移聚类结构。可以分为两个步骤: 1. Cluster initialization(聚类初始化):根据设定的聚类半径,通过滑动窗口计算每个窗口内数据点的密度,并以此为基础,建立初始化的微簇列表。 2. Data point processing(数据点处理):在中遍历数据点,根据距离和时间戳,将点加入合适的微簇,或者形成新的微簇。 聚类融合部分关注于聚类的演变,去除不稳定的聚类,并保证稳定的聚类之间的距离的正确性。基于聚类的演变,DenStream提出了两个主要的概念:聚类驻留时间和聚类漂移。 聚类合并部分主要关注于聚类之间的关系管理,包括聚类之间的合并和拆分。聚类合并的影响因素主要包括驻留时间、聚类边界和数据点稠密程度。 总的来说,DenStream是一种高效的数据聚类算法,适用于需要在时间序列数据中进行实时聚类或离群点检测的场景。DenStream的实现包括聚类构建、聚类融合和聚类合并三个步骤。这个算法结合了均值漂移聚类和DBSCAN算法的思想,能够自适应的调整聚类数量和大小。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值