DPC-Clustering by fast search and find of density peaks 2014

本文详细介绍了CBDP算法,一种利用高斯核计算数据点密度的聚类方法。算法通过计算每个点的密度和deltai,绘制决策图,并人工选择聚类中心。虽然高斯核提供了连续的密度评估,但该算法存在局限性,如仅适用于单一局部最大密度类别的数据集,且对不同类间密度差异敏感,还需要人为设定截断距离。此外,维度增加会增加距离度量误差对结果的影响。
摘要由CSDN通过智能技术生成

步骤:

1 计算两个参数(每个点的密度,每个点的deltai)
2 画图(决策图)
3 人工筛选聚类中心,然后把剩余点归到离自己最近的中心
(1)密度:两种计算方式:基于截断核的计算+基于高斯核的计算方式
截断核的计算:画个半径数个数
高斯核的计算:高斯模型
两种方式对比:使用截断核计算得到的结果为离散值而使用高斯核计算得到的结果为连续值。因此,相对而言,使用高斯核计算得到的数据点具有相同的局部密度的概率比使用截断核计算得到的数据点具有相同的局部密度的概率要小,比较密度大小关系更方便
(2)deltai(与高密度点的距离):依次扩大半径,只要找到一个比自己密度大的点,计算距离,作为deltai。
最大密度点的deltai:该点与最远一个点的距离
在这里插入图片描述

不足:

(1)CBDP 算法只能处理一个类中有且只有一个局部最大密度点的数据集,即类内数据分布不均匀的数据集
(2)CBDP 算法只适合处理不同类的数据密度差距不大的数据集
(3)人为引入了截断距离的参数,人为选择聚类中心
(4)维度的增加使得距离度量过程中误差对结果的影响大大增加

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值