密度峰值聚类算法介绍(DPC)

赵孝正

已于 2022-08-16 16:12:48 修改

阅读量2.3k

点赞数

分类专栏： # 聚类文章标签：聚类算法机器学习

于 2022-07-25 09:16:54 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46713695/article/details/125967823

版权

聚类专栏收录该内容

25 篇文章

订阅专栏

目录

引言
一、DPC算法
- 1.1 DPC算法的两个假设
- 1.2 DPC算法的两个重要概念
2.方法模型
2.1 稳健深度自编码器

引言

Rodriguez 等于2014年提出快速搜索和寻找密度峰值的聚类(clustering by fast search and find of density peaks)，简称密度峰值聚类(density peaks clustering，DPC)算法。

一、DPC算法

1.1 DPC算法的两个假设

1）类簇中心被类簇中其他密度较低的数据点包围；
2）类簇中心间的距离相对较远。

1.2 DPC算法的两个重要概念

1）局部密度
设有数据集为 $X_{N\times M}=[x_1, x_2, … ,x_N ]^T$ ，其中 $x_i=[x_{i1}, x_{i2}, … ,x_{iM} ]^T$ ，N为样本个数，M为样本维数。

对于样本点 i 的局部密度，局部密度有两种计算方式，离散值采用截断核的计算方式，连续值则用高斯核的计算方式。

2.方法模型

2.1 稳健深度自编码器

深度自编码器（Deep Auto-Encoder, DAE）被大量应用在图像识别，噪声去除与数据降维领域。

它是一种无监督学习算法，模型期望输出与输入相同。

参考链接
[1] 密度峰值聚类算法(DPC) 2021.11
[2] 基于相互邻近度的密度峰值聚类算法 2021.3

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。