DBSCAN算法简介与Python实现
第一次写博客,就挑了一篇数据挖掘课下实现的算法,尝试用自己的理解介绍清楚,参考教材是《数据挖掘概念与技术-第3版》。不当之处请大家指出。
一、基本思想
DBSCAN(Density-Based Spatial Clustering of Applications with Noise)是一种基于密度的空间聚类算法,直白翻译就是带有噪声应用的基于密度的空间聚类。
在了解DBSCAN算法前,先来学习一下密度聚类的几个常见概念:
- ϵ−邻域:以某个对象为中心、以ϵ为半径的空间; ϵ − 邻 域 : 以 某 个 对 象 为 中 心 、 以 ϵ 为 半 径 的 空 间 ;
- 核心对象ο:其领域稠密的对象,即该对象ϵ−领域内至少包括MinPts个对象; 核 心 对 象 ο : 其 领 域 稠 密 的 对 象 , 即 该 对 象 ϵ − 领 域 内 至 少 包 括 M i n P t s 个 对 象 ;
- 直接密