参考文献:DenPEHC-Density peak based efficient hierarchical clustering(Information Sciences 2016 B)
1、改进:
- DPC是划分聚类(flat clustering),不能发现群组的层次结构
- 能够对大规模、高维数据集(LSHD)进行聚类
2、主要思想
- 利用 γ ( γ=ρ∗δ ),运用线性拟合的方法,选择聚类中心,不需要r人工选择
- 根据 γ曲线 寻找stairs以得到群组的层次结构。
- 使用grid granulation,使得DPC能够处理大规模、高维数据
3、DenPEHC
首先选择所有潜在的聚类中心,然后在 γ曲线中确定stairs,最后每一层的中心被用于将leading tree转换成森林,森林中每一颗子树代表一个聚类。
一些符号定义:
3.1、确定聚类中心
- 将γ倒序排序: [γs⃗ ,γInd→]=sortDescending(γ⃗ ) , γs