数据挖掘笔记-聚类-DBSCAN-原理与简单实现

人生偌只如初见

已于 2023-01-30 18:25:11 修改

阅读量3.4k

点赞数

分类专栏： DataMining 文章标签：数据挖掘聚类 DBSCAN 密度算法

于 2014-06-30 16:08:49 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fighting_one_piece/article/details/36007655

版权

本文介绍了数据挖掘中的DBSCAN聚类算法，详细解释了Ε领域、核心对象、直接密度可达、密度可达和密度相连等概念，并通过一个示例展示了如何判断核心对象及其关系。接着，文章探讨了DBSCAN算法的目标是找到密度相连对象的最大集合。最后，给出了使用Java实现DBSCAN算法的简要说明。

摘要由CSDN通过智能技术生成

DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一个比较有代表性的基于密度的聚类算法。与划分和层次聚类方法不同，它将簇定义为密度相连的点的最大集合，能够把具有足够高密度的区域划分为簇，并可在噪声的空间数据库中发现任意形状的聚类。该算法的目的在于过滤低密度区域，发现稠密度样本点，跟传统的基于层次聚类和划分聚类的凸形聚类簇不同，该算法可以发现任意形状的聚类簇，与传统的算法相比它有如下优缺点：

优点

1. 与K-means方法相比，DBSCAN不需要事先知道要形成的簇类的数量。

2. 与K-means方法相比，DBSCAN可以发现任意形状的簇类。

3. 同时，DBSCAN能够识别出噪声点。

4.DBSCAN对于数据库中样本的顺序不敏感，即Pattern的输入顺序对结果的影响不大。但是，对于处于簇类之间边界样本，可能会根据哪个簇类优先被探测到而其归属有所摆动。

缺点：

1. DBScan不能很好反映高尺寸数据。

2. DBScan不能很好反映数据集以变化的密度。

DBSCAN中的的几个定义：

Ε领域：给定对象半径为Ε内的区域称为该对象的Ε领域

核心对象：如果给定对象Ε领域内的样本点数大于等于MinPts，则称该对象为核心对象。

直接密度可达：对于样本集合D，如果样本点q在p的Ε领域内，并且p为核心对象，那么对象q从对象

最低0.47元/天解锁文章

人生偌只如初见

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

人生偌只如初见 CSDN认证博客专家 CSDN认证企业博客

码龄17年

153: 原创

2万+: 周排名

1万+: 总排名

50万+: 访问

: 等级

6062: 积分

623: 粉丝

181: 获赞

138: 评论

314: 收藏

私信

关注

热门文章

分类专栏

NebulaGraph 2篇
Doris 1篇
DataMining 49篇
Python 33篇
J2EE 26篇
ElasticSearch 14篇
Spark 12篇
XXL-JOB 3篇
Neo4j 4篇
Flink 2篇
Hadoop 6篇
ES-Hadoop 2篇
HBase 6篇
Hive 3篇
Tez 2篇
Kafka 5篇
Storm 3篇
JStorm 1篇
Tachyon 2篇
Oozie 1篇
Cassandra 1篇
Titan 2篇
Lucene 1篇
Redis 4篇
MongoDB 3篇
Akka 1篇
DataX 3篇
Crawler 4篇
Docker 3篇

最新评论

Java学习笔记-EXCEL文件的读写操作
qq_27475765: String sheetId = "rId1"; 这个rld1是怎么知道的。
Sanic学习笔记-搭建简单WEB基础框架
jeffreyshou: 老大，《Sanic学习笔记-搭建简单WEB基础框架》完整代码有吗？想学习下，谢谢
ElasticSearch学习笔记-Vector向量搜索记录
天津图芬奇: 搜索速度会根据数据规模线性增加，如果数据量大的话，不太可行，可以参考基于elasticsearch实现大规模向量检索这篇csdn博客，将向量搜索转成全文检索，搜索速度以及效率大大提升。
Neo4j学习笔记-Embedded嵌入模式简单示例
rainysky7: 请问作者有NEO4J的学习资源嘛，我想付费获取。最近在做一个用java开发后端的小项目，需要用NEO4J来做数据库，用java操作Neo4j，想找资料学习
Sanic学习笔记-搭建简单WEB基础框架
LaoYuanPython: 有幸阅读博主才出炉不到2天的大作！谢谢博主提供的案例代码分享!如此好文,点赞感谢！欢迎博主到本人的Python专栏来交流！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。