Clustering by fast search and find of density peaks
论文精度报告
作者:纪元
本文遵循CC-BY-NC-SA协议
(署名-非商业性-相同方式共享)核心思想
簇心具有两个特征:
- 离其他高密度点 最远
- 周边密度值 最大
现有劣势
当前算法主要为K均值聚类和DBSCAN
- K均值聚类:只能解决球状问题,需要提前定义簇的总数,需要迭代划分。
- DBSCAN:需要提前定义阈值,计算量相对较大,且只对坐标上数据有效。
相对优势
能解决非球状分布问题,不需要将数据做成表(原文为"向量空间"),在划分时不需要迭代优化。
算法参数
δ \delta δ:表示该点距最近的高密度点(目标点密度大于该点本身密度)距离
ρ \rho ρ:表示该点周边密度。计算方法为:统计该点周围,与其距离小于 d c d_c