【论文】Clustering by fast search and find of density peaks

文章介绍

本文所提的方法是用来发现聚类中心点的,提供一种全新的思路,算法思想也很简单

文章内容

提出了两个假设:
1)聚类中心的密度要比它的邻居节点高
2)聚类中心点到另一个比它密度更高点的距离相对较大

定义了三个变量:
1)局部密度p
2)当前点到密度更高点的距离sigma
3)截断距离d

三个变量的计算方法:
1)局部密度等于截断距离范围内点的数量。
2)sigma为当前点到密度更高点的距离,如果是密度最高的点,就是该点到最远点的距离。
3)阶段距离的选取应使得包含的邻居节点数目在1%——2%

计算出局部密度和距离,根据这两个坐标画出决策图。位于决策图右上角,也就是局部密度和sigma都较高的点被认为是聚类中心点。至于这个点是如何选取的它并没有说明。后续提出了将两者的乘积做个排序进行选取中心点。但是并不能保证所选点的正确性。

在这里插入图片描述
左边是样本点的分布,右边是计算出两个变量后画出的决策图,节点1和节点10可被选为聚类中心。

作者后来又提出了聚类的方法,找出聚类中心点后将所有的点就近分配给这些中心点。
又提出在小规模的数据集上可能有较大的统计误差,所以就只分配截断距离内的点。

文章总结

该算法为寻找聚类中心点提供了全新的思路,但是作者提出的聚类方法漏洞还是很多。下一个论文,就是基于这个方法的改进。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值