HDBScan
基于层次密度的应用空间聚类
有噪音。在不同的epsilon值上执行dbscan并集成
找到一个聚类的结果,它比epsilon更稳定。
这使得hdbscan能够找到密度不同的集群(与dbscan不同)。
对参数选择更加稳健。
实际上,这意味着hdbscan直接返回一个好的集群
只需很少或根本没有参数调整,而主要参数,
最小群集大小,直观且易于选择。
HDBScan是探索性数据分析的理想选择;它是一种快速和健壮的
可以信任的算法返回有意义的集群(如果有
有)。
根据论文:
< Buff行情>
McInnes L,Healy J.
基于加速分层密度的聚类
在:2017年IEEE国际数据挖掘研讨会(ICDMW),IEEE,第33-42页。
2017年
[pdf]
R.Campello、D.Moulavi和J.Sander,
基于密度的聚类
层次密度估计
in:知识发现的进展数据挖掘,斯普林格,160-172页。
2013
阅读文档(包括教程)可在http://hdbscan.readthedocs.io/en/latest/" rel="nofollow">http://hdbscan.readthedocs.io/en/latest/上找到。
笔记本电脑将HDBScan与其他群集算法进行比较scan/blob/master/notebooks/how%20hdbscan%20works.ip