DBSCAN

最新推荐文章于 2024-05-27 13:47:13 发布

火鸡哥

最新推荐文章于 2024-05-27 13:47:13 发布

阅读量1k

点赞数

分类专栏：机器学习非监督学习

本文链接：https://blog.csdn.net/u012587024/article/details/82969385

版权

机器学习同时被 2 个专栏收录

33 篇文章 1 订阅

订阅专栏

非监督学习

5 篇文章 0 订阅

订阅专栏

DBSCAN

DBSCAN是一种密度聚类算法，它基于一组参数( $\epsilon$ ,MinPts)来刻画样本分布的紧密程度。

1､算法原理

如上图所示，DBSCAN的有两个非常重要的参数 $\epsilon$ 和MinPts；图中
“归同类"的意思是"如果该范围内有样本已经归类，则这些样本都属于该类；否则就创建一个新类别，这些样本都属于这个新类别”。
$\epsilon$ ：指的是范围半径；
$M i n P t s$ ：指的是聚为一类的最小样本数；

2､sklearn中的DBSCAN

from sklearn import cluster
dbscan = cluster.DBSCAN(eps=1.2, min_samples=10)
clustering_labels = dbscan.fit(train_data)

3､DBSCAN的优缺点

在这里插入图片描述
如图一、四，DBSCAN对离散型数据的聚类效果并不好；图五效果不好的原因是参数 $\epsilon$ 的值太大了，只要 $\epsilon$ 的值设置好了，图五也能很好地聚类；DBSCAN能识别噪音，可以很好地不受噪音的影响。

火鸡哥

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
DBSCAN

DBSCANDBSCAN是一种密度聚类算法，它基于一组参数(ϵ\epsilonϵ,MinPts)来刻画样本分布的紧密程度。1､算法原理如上图所示，DBSCAN的有两个非常重要的参数ϵ\epsilonϵ和MinPts；图中“归同类&amp;amp;quot;的意思是&amp;amp;quot;如果该范围内有样本已经归类，则这些样本都属于该类；否则就创建一个新类别，这些样本都属于这个新类别”。ϵ\epsilonϵ：指的是范围半径；MinP...
复制链接

扫一扫