论文阅读---Clustering by fast search and find of density peaks

静仔小鱼大中华地区代言人

于 2021-11-26 15:04:47 发布

阅读量398

点赞数

分类专栏：论文阅读文章标签：聚类机器学习无监督学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41643701/article/details/121544999

版权

论文阅读专栏收录该内容

15 篇文章 1 订阅

订阅专栏

原文提出了一种聚类密度峰值的方法

聚类 Clustering：即将数据对象的集合分成相似对象的过程
在这里插入图片描述

本文假设聚类中心被具有较低局部密度的邻居包围，并且它们与具有较高局部密度的任何点的距离相对较大。

$\rho_{i}=\sum\limits_{j} \chi(d_{ij}-d_{\mathrm{c}})$ where $\chi(x)=1$ if $x < 0$ and $\chi(x) =0$ otherwise

公式分析：

$\rho_{i}$ 表示点 $i$ 的局部密度
$d_{ij}$ 表示点 $i$ 和点 $j$ 的距离
$d_c$ 表示一个界

通俗来说呢，所谓的点的局部密度，以这个点为中心， $d_c$ 为半径，画一个圈圈，数一下圈圈里面点的个数，就是这个点的局部密度啦。这个点的局部密度越大，它越可能是簇中心。
在一个数据集上找簇中心的过程就好像在地图上找市中心的过程。即一个人的邻居越多，这个人越可能居住在市中心。

但是如果单纯的使用局部密度的大小来找出市中心，可能会出现一个问题。比如小红住在成都市中心的幸福小区，小明住在幸福小区对面的快乐小区，而小王住在绵阳市中心的碧波豪庭。由于成都市中心的人口比绵阳的多，所以小红和小明的邻居都比小王的多，于是当按照邻居数量的多少来找市中心的时候，找了好几个市中心都在成都市，没办法找到绵阳的小王了。

于是作者提出了一个新的指标 $\delta$ 来解决此问题

$\delta_i=\min\limits_{j:\rho_j>\rho_i}(d_{ij})$
for the point with highest density: $\delta_i=\max_j(d_{ij})$

公式分析：

$d_{ij}$ 表示点 $i$ 和点 $j$ 的距离
$\delta_i$ 表示距离点 $i$ 最近且局部密度比点 $i$ 高的点和点 $i$ 的距离
当点 $i$ 为局部密度最高的点时， $\delta_i$ 为和它最远的点的距离

我们把 $\delta$ 值异常大的点作为聚类中心

静仔小鱼大中华地区代言人

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
论文阅读---Clustering by fast search and find of density peaks

原文提出了一种聚类密度峰值的方法聚类 Clustering：即将数据对象的集合分成相似对象的过程本文假设聚类中心被具有较低局部密度的邻居包围，并且它们与具有较高局部密度的任何点的距离相对较大。ρi=∑jχ(dij−dc)\rho_{i}=\sum_{j} \chi(d_{ij}-d_{\mathrm{c}})ρi=j∑χ(dij−dc)...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。