算法笔记（12）DBSCAN算法及Python代码实现

编程研究坊

已于 2023-02-15 14:08:59 修改

阅读量733

点赞数

分类专栏： python 人工智能算法文章标签：算法 python 聚类

于 2022-05-18 14:43:47 首次发布

本文链接：https://blog.csdn.net/li1873997/article/details/124841953

版权

人工智能同时被 3 个专栏收录

74 篇文章 5 订阅

订阅专栏

算法

67 篇文章 0 订阅

订阅专栏

python

49 篇文章 3 订阅

订阅专栏

DBSCAN是一种无监督的机器学习聚类算法，基于数据密度进行划分。它无需预先设定聚类数量，通过eps参数定义邻域距离，min_samples参数设置邻域内点的最小数量。在Python中，可以使用sklearn库实现DBSCAN，通过fit_predict方法对数据进行聚类，并用matplotlib可视化结果。

摘要由CSDN通过智能技术生成

聚类算法主要包括K均值（K-Means）聚类、凝聚聚类以及DBSCA算法。本节主要介绍DBSCA算法
DBSCAN是一种基于密度的空间聚类算法，是一种无监督的ML聚类算法。它可以替代KMeans和层次聚类等流行的聚类算法。
DBSCAN算法的工作原理：通过对特征空间内的密度进行检测，密度大的地方会认为是一个类，而密度相对小的地方它会认为是一个分界线，不需要一开始指定聚类的数量。
DBSCA算法有两个非常重要的参数：一个是eps,一个是min_samples。eps指定的是考虑划入同一坨的样本距离有多远，min_samples参数指定的是在某个数据点周围，被看成是聚类核心点的个数。

python代码实现

blobs = make_blobs(random_state=1,centers=1)
X_blobs = blobs[0]
db = DBSCAN()
clusters = db.fit_predict(X_blobs)
plt.scatter(X_blobs[:, 0], X_blobs[:, 1], c=clusters, cmap=plt.cm.cool,
            s=60,edgecolor='k')
plt.xlabel("Feature 0")
plt.ylabel("Feature 1")
plt.show()

输出结果如下：

编程研究坊

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
算法笔记（12）DBSCAN算法及Python代码实现

DBSCAN算法的工作原理：通过对特征空间内的密度进行检测，密度大的地方会认为是一个类，而密度相对小的地方它会认为是一个分界线，不需要一开始指定聚类的数量。DBSCA算法有两个非常重要的参数：一个是eps,一个是min_samples。eps指定的是考虑划入同一坨的样本距离有多远，min_samples参数指定的是在某个数据点周围，被看成是聚类核心点的个数。
复制链接

扫一扫