【论文】Clustering by fast search and find of density peaks

最新推荐文章于 2022-07-21 21:54:33 发布

不爱吃胡萝卜的小胡

最新推荐文章于 2022-07-21 21:54:33 发布

阅读量150

点赞数

分类专栏：论文文章标签：聚类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_46622555/article/details/116377284

版权

论文专栏收录该内容

5 篇文章 0 订阅

订阅专栏

文章介绍

本文所提的方法是用来发现聚类中心点的，提供一种全新的思路，算法思想也很简单

文章内容

提出了两个假设：
1）聚类中心的密度要比它的邻居节点高
2）聚类中心点到另一个比它密度更高点的距离相对较大

定义了三个变量：
1）局部密度p
2）当前点到密度更高点的距离sigma
3）截断距离d

三个变量的计算方法：
1）局部密度等于截断距离范围内点的数量。
2）sigma为当前点到密度更高点的距离，如果是密度最高的点，就是该点到最远点的距离。
3）阶段距离的选取应使得包含的邻居节点数目在1%——2%

计算出局部密度和距离，根据这两个坐标画出决策图。位于决策图右上角，也就是局部密度和sigma都较高的点被认为是聚类中心点。至于这个点是如何选取的它并没有说明。后续提出了将两者的乘积做个排序进行选取中心点。但是并不能保证所选点的正确性。

在这里插入图片描述
左边是样本点的分布，右边是计算出两个变量后画出的决策图，节点1和节点10可被选为聚类中心。

作者后来又提出了聚类的方法，找出聚类中心点后将所有的点就近分配给这些中心点。
又提出在小规模的数据集上可能有较大的统计误差，所以就只分配截断距离内的点。

文章总结

该算法为寻找聚类中心点提供了全新的思路，但是作者提出的聚类方法漏洞还是很多。下一个论文，就是基于这个方法的改进。

不爱吃胡萝卜的小胡

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【论文】Clustering by fast search and find of density peaks

文章介绍本文所提的方法是用来发现聚类中心点的，提供一种全新的思路，算法思想也很简单文章内容提出了两个假设：1）聚类中心的密度要比它的邻居节点高2）聚类中心点到另一个比它密度更高点的距离相对较大定义了三个变量：1）局部密度p2）当前点到密度更高点的距离sigma3）截断距离d三个变量的计算方法：1）局部密度等于截断距离范围内点的数量。2）sigma为当前点到密度更高点的距离，如果是密度最高的点，就是该点到最远点的距离。3）阶段距离的选取应使得包含的邻居节点数目在1%——2%计算出局
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。