Clustering by fast search and find of density peaks

最新推荐文章于 2021-02-02 11:10:42 发布

bityourtail

最新推荐文章于 2021-02-02 11:10:42 发布

阅读量778

点赞数 3

分类专栏：数据挖掘文章标签： clustering 搜索 sci14 density peaks

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/youxier/article/details/54881483

版权

数据挖掘专栏收录该内容

2 篇文章 0 订阅

订阅专栏

近期要研究聚类算法，便把sci14年的那篇找了出来，实现了一遍，并且进行了优缺点的总结和改进。附代码，详细叙述如下。

sci14年发表的聚类算法是一篇经典的算法，它的主要思想是：在聚类中，类中心往往是密度较大，而且离其他类中心较远的点。先通过找到类中心，再将其他点归并到最近的类中心即可。

它寻找类中心主要是求两个值：密度阈值rou和中心点的距离deta，求得方法可根据论文提示中来。求出那两个参数后，选出rou和deta都大的点作为聚类中心（也就是坐标轴右侧的点，一般可选rou*deta较大的点作为聚类中心）

）

优缺点

它的优点显而易见，思想简单，编程实现容易，有说服力。但也存在着缺点：1.两两之间求聚离，时间复杂度为o(n ²)，不适合点数较多的计算；2.画圈半径dc的选取，文中提到的是能够圈住总点数的1%~2%的值作为半径，这是一个经验值，没有理论支撑；3.对一些非凸的图形，聚类效果不好。

总结

聚类算法各有优缺点，没有哪一种算法能适合所有数据集，我们能做的，就是先分析数据集具有什么特性，根据它的特性，选择最合适的算法。

关注

3
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
Clustering by fast search and find of density peaks

近期要研究聚类算法，便把sci14年的那篇找了出来，实现了一遍，并且进行了优缺点的总结和改进。附代码，详细叙述如下。sci14年发表的聚类算法是一篇经典的算法，它的主要思想是：在聚类中，类中心往往是密度较大，而且离其他类中心较远的点。先通过找到类中心，再将其他点归并到最近的类中心即可。它寻找类中心主要是求两个值：密度阈值rou和中心点的距离deta，求得方法可根据论文提示中来。求出那两个参
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。