热门算法总结 —— DPCA

最新推荐文章于 2023-08-02 10:05:05 发布

稀饭居然不在家

最新推荐文章于 2023-08-02 10:05:05 发布

阅读量2.8k

点赞数

文章标签：算法聚类机器学习数据分析数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/A_1245/article/details/123576723

版权

密度峰值聚类算法(DPCA)是一种基于簇类中心点高密度和远距离的假设进行聚类的方法。它适用于非球形簇的发现，计算速度快，但需人工选取聚类中心，可能导致簇划分不准确。DPCA适用于数据分布描述和密度聚类，其优点在于无需向量空间映射，但处理大数据时内存和计算开销大。在小明班级成绩聚类模拟中，成功区分出普通学生、学霸和学渣群体。

摘要由CSDN通过智能技术生成

1、算法简介

（1）概述：密度峰值聚类算法（DPCA）是一种可以发现非凸簇类的新型聚类算法，该算法的核心思想建立在对簇类中心点或者密度峰值点的两个重要假设之上:

[1] 假设一：簇类中心点的局部密度大于其周围相邻点的局部密度；

[2] 假设二：簇类中心点与其他中心点间有着相对较大的距离。

上述两种假设在给出簇类中心点描述的同时，也给出了一种检测中心点的准则。

该算法的核心思想在于对聚类中心点的计算，聚类中心点具有本身密度大和与其他密度更大的数据点之间的距离相对更大的特点。算法首先通过使用一截断距离来计算每个点的局部密度，然后计算各数据点与局部密度高于它们的数据点之间的最小距离；然后根据计算出的每个点的局部密度和最小距离绘制决策图，接着在决策图中人工选取聚类的中心，之后将剩余的非聚类中心的数据点划分到与之距离最近的聚类中心所在的簇中；最后再将所得到的各个簇划分为簇核心和簇光晕，从而得到最终的聚类结果。使用DPCA算法进行聚类时只需要计算一次距离，并且不需要进行迭代，因此算法的计算速度很快。但是，该算法选择聚类中心的时候需要在决策图中人工选取，这增加了算法的冗余性，不利于算法的自动化，且在最后将簇划分为簇核心和簇光晕时会将簇边缘的本属于簇核心的一些点划分到簇光晕中，影响最终的聚类效果。

（2）主要用途：密度聚类，同DBSCAN算法，发现数据中的类别关系。

（3）优缺点

[1] 优点：该聚类算法可以得到非球形的聚类结果，可以很好地描述数据分布ÿ

最低0.47元/天解锁文章

稀饭居然不在家

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

稀饭居然不在家 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。