作者:风弦鹤CSDN
博客地址:
https://blog.csdn.net/huacha__/article/details/81094891
说明:本文经作者授权转载,禁止二次转载
本文主要内容:
1、前言
2、DBSCAN聚类算法
3、参数选择
4、DBSCAN算法迭代可视化展示
5、常用评估方法:轮廓系数
6、用Python实现DBSCAN聚类算法
一、前言
去年学聚类算法的R语言的时候,有层次聚类、系统聚类、K-means聚类、K中心聚类,最后呢,被DBSCAN聚类算法迷上了。
为什么呢,首先它可以发现任何形状的簇,其次我认为它的理论也是比较简单易懂的,今年在python这门语言上我打算好好研究DBSCAN。
下面贴上它的官方解释:
DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)是一种基于密度的空间聚类算法。
该算法将具有足够密度的区域划分为簇,并在具有噪声的空间数据库中发现任意形状的簇,它将簇定义为密度相连的点的最大集合。
二、DBSCAN聚类算法
文字描述不好懂,先看下面这个图:
上面这些点是分布