DBSCAN密度聚类

最新推荐文章于 2023-03-08 22:38:58 发布

抢我糖还想跑

最新推荐文章于 2023-03-08 22:38:58 发布

阅读量449

点赞数 1

分类专栏：聚类算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41749451/article/details/119455925

版权

聚类算法专栏收录该内容

30 篇文章 10 订阅

订阅专栏

A density-based algorithm for discovering clusters in large spatial databases with noise

基础定义

邻域：对于任意样本i和给定距离e，样本i的e邻域是指所有与样本i距离不大于e的样本集合；
核心对象：若样本i的e邻域中至少包含MinPts个样本，则i是一个核心对象；
密度直达：若样本j在样本i的e邻域中，且i是核心对象，则称样本j由样本i密度直达；
密度可达：对于样本i和样本j，如果存在样本序列p1，p2，…，pn，其中p1=i，pn=j，并且pm由pm-1密度直达，则称样本i与样本j密度可达；
密度相连：对于样本i和样本j，若存在样本k使得i与j均由k密度可达，则称i与j密度相连。

DBSCAN 将簇定义为：由密度可达关系导出的最大的密度相连样本集合。

缺点：

1、受到欧式距离的通病维数灾难的影响
2、对于在密度上有较大差异的数据，
3、最小样本个数 MinPts 的选取又非常困难。

在这里插入图片描述
MinPts=3 的时候，虚线圆圈为 e 邻域，x1 是核心对象，x2 由 x1 密度直达，x3 由 x1 密度可达，x3 与 x4 密度相连。

抢我糖还想跑

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
DBSCAN密度聚类

A density-based algorithm for discovering clusters in large spatial databases with noise基础定义邻域：对于任意样本i和给定距离e，样本i的e邻域是指所有与样本i距离不大于e的样本集合；核心对象：若样本i的e邻域中至少包含MinPts个样本，则i是一个核心对象；密度直达：若样本j在样本i的e邻域中，且i是核心对象，则称样本j由样本i密度直达；密度可达：对于样本i和样本j，如果存在样本序列p1，p2，…，pn，其中
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。