面向流形数据的共享近邻密度峰值聚类算法

最新推荐文章于 2024-07-06 16:11:18 发布

宋罗世家技术屋

最新推荐文章于 2024-07-06 16:11:18 发布

阅读量96

点赞数

分类专栏：综合技术探讨及方案专栏文章标签：算法聚类数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_61890005/article/details/134758182

版权

综合技术探讨及方案专栏专栏收录该内容

52 篇文章 11 订阅 ¥69.90 ¥99.00

订阅专栏

超级会员免费看

摘要: 流形数据由一些弧线状或环状的类簇组成，其特点是同一类簇的样本间距离差距较大。密度峰值聚类算法不能有效识别流形类簇的类簇中心且分配剩余样本时易引发样本的连续误分配问题。为此，本文提出面向流形数据的共享近邻密度峰值聚类(density peaks clustering based on shared nearestneighbor for manifold datasets, DPC-SNN)算法。提出了一种基于共享近邻的样本相似度定义方式，使得同一流形类簇样本间的相似度尽可能高；基于上述相似度定义局部密度，不忽略距类簇中心较远样本的密度贡献，能更好地区分出流形类簇的类簇中心与其他样本；根据样本的相似度分配剩余样本，避免了样本的连续误分配。DPC-SNN算法与DPC、FKNN-DPC、FNDPC、DPCSA及IDPC-FA算法的对比实验结果表明，DPC-SNN算法能够有效发现流形数据的类簇中心并准确完成聚类，对真实以及人脸数据集也有不错的聚类效果。

关键词:
密度峰值 /
聚类分析 /
流形数据 /
K近邻 /
共享近邻 /
流形数据 /
样本相似度 /
数据挖掘 /
图像处理

聚类算法是在不存在先验知识的前提下，依据类簇内样本相似度尽可能大而类簇间的样本相似度尽可能小的原则，将样本划分成多个类簇。迄今为止，聚类算法已被广泛应用于社区检测[1]、生物信息[2]、网络安全[3]、图像处理[4]、模式识别[5]等多种不同领域。

聚类算法问世至今，已有多种聚

了解本专栏

超级会员免费看

宋罗世家技术屋

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
面向流形数据的共享近邻密度峰值聚类算法

流形数据由一些弧线状或环状的类簇组成，其特点是同一类簇的样本间距离差距较大。密度峰值聚类算法不能有效识别流形类簇的类簇中心且分配剩余样本时易引发样本的连续误分配问题。为此，本文提出面向流形数据的共享近邻密度峰值聚类(density peaks clustering based on shared nearestneighbor for manifold datasets, DPC-SNN)算法。提出了一种基于共享近邻的样本相似度定义方式，使得同一流形类簇样本间的相似度尽可能高；
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

宋罗世家技术屋 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。