思想:DenStream可以说是针对Clustream的缺陷进行改进的,通过引入CMC(核心微簇),PMC(潜在核心微簇)以及OMC(离群微簇)以及时间衰减函数f(t)=2-λ来对不同时间的数据点的重要性进行加权。对微簇micro-cluster的定义也加入了时间权重。
方法:在线阶段,同时维护PMC和OMC两个队列,根据在两个队列的权重变化来对微簇的在潜在核心和离群两个角色进行调整变化。在线下阶段,通过改进的DBSCAN算法对 PMC进行聚类,最终获得聚类结果。
步骤:
on-line phase:
Merging (p)
1: Try to merge p into its nearest p-micro-cluster cp;
2: if rp (the new radius of cp) ≤εthen
3: Merge p into c