聚类分析(三)——DBSCAN算法

一.简介

DBSCAN算法是一种基于密度的聚类算法。

基于密度的聚类算法会寻找被低密度区域分离的高密度区域。

.

该算法我们首先需要将所有的点分为:核心点,边界点,噪声点。

区分这些点的依据是根据我们提前给出的MinPts和Eps,这里假设我们提前给定MinPts=7
核心点:如果该点的给定邻域内点的个数超过给点的阈值MinPts。下图的点A,以A为圆心,Eps为半径的区域内共有7个点(包括点A和点B一共7个),那么A就是核心点。

边界点:边界点不是核心点,但它落在核心点的邻域内。 下图的点B,以B为圆心,Eps为半径的区域只有4个点,小于MinPts,所以B不是核心点,但由于它落在核心点A的邻域内,所以它是边界点。

噪声点:噪声点是除了核心点和边界点之外的点。如点C,以C为圆心,Eps为半径的区域内只有3个点,所以它不是核心点,并且它不在A的邻域内,所以它不是边界点。所以它为噪声点。
在这里插入图片描述

二.DBSCAN算法

1.将所有的点标记为核心点、边界点、噪声点
2.删除噪声点
3.为距离在Eps之内的所有核心点直接赋予一条边
4.每组连通的核心点形成一个簇
5.将每个边界点指派到一个与之关联的核心点所在的簇中

参考书籍:
《数据挖掘导论》由人民邮电出版社出版,[美]作者Pang-Ning Tan,Michael Steinbach,Vipin Kumar 合著

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值