sklearn无监督学习-聚类DBSCAN

生如夏花~之绚烂

于 2019-05-07 15:01:33 发布

阅读量662

点赞数

分类专栏：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41663800/article/details/89917252

版权

机器学习专栏收录该内容

12 篇文章 0 订阅

订阅专栏

之前我的文章提到了k-means算法https://blog.csdn.net/qq_41663800/article/details/89879604，这篇文章就是另一个很经典的算法，DBSCAN算法
首先谈一谈两种聚类方法的区别吧，我也是初学者，说的不好还请见谅
1.DBSCAN算法聚类是要把噪声剔除的，而k-means算法只是把噪声数据分到了最近的簇里
2.k-means算法是把数据分成了k个簇，而DBSCAN算法聚类不指定簇的个数，最终的簇的个数是不定的
下面我来介绍一下DBSCAN算法

DBSCAN算法是一种基于密度的聚类算法

聚类的时候不需要预先指定簇的个数
最终的簇的个数不定

DBSCAN算法将数据点分为三类

核心点：在半径Eps内含有超过MinPts数目的点
边界点：在半径Eps内点的数量小于MinPts，但是落在核心点的邻域内
噪声点：既不是核心点也不是边界点

DBSCAN算法流程

1.将所有点标记为核心点。边界点或者噪声点
2.删除噪声点
3.为距离在Eps之内的所有的核心点之间赋予一条边
4.每组立案庭的核心点形成一个簇
5.将每个边界点指派到一个与之关联的核心点的簇中（哪一个核心点的半径之内）

DBACAN主要参数

eps：两个样本被看作邻居节点的最大距离
min_samples:簇的样本数
metric：距离计算方式
例：sklearn.cluster.DBSCAN(eps=0.5,min_samples=5,metric=‘euclidean’)

生如夏花~之绚烂

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。