DBScan 算法

最新推荐文章于 2024-05-27 13:47:13 发布

SummmerSnow

最新推荐文章于 2024-05-27 13:47:13 发布

阅读量626

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/u011415481/article/details/51250990

版权

机器学习专栏收录该内容

11 篇文章 0 订阅

订阅专栏

DBScan 是一种基于密度的聚类算法，主要算法流程如下图：

DBSCAN(D, eps, MinPts)
   C = 0                                          //类别标示
   for each unvisited point P in dataset D        //遍历
      mark P as visited                           //已经访问
      NeighborPts = regionQuery(P, eps)           //计算这个点的邻域    
      if sizeof(NeighborPts) < MinPts             //不能作为核心点
         mark P as NOISE                          //标记为噪音数据
      else                                        //作为核心点，根据该点创建一个类别
         C = next cluster
         expandCluster(P, NeighborPts, C, eps, MinPts)    //根据该核心店扩展类别
          
expandCluster(P, NeighborPts, C, eps, MinPts)
   add P to cluster C                                     //扩展类别，核心店先加入
   for each point P' in NeighborPts                       //然后针对核心店邻域内的点，如果该点没有被访问，
      if P' is not visited
         mark P' as visited                               //进行访问
         NeighborPts' = regionQuery(P', eps)              //如果该点为核心点，则扩充该类别
         if sizeof(NeighborPts') >= MinPts
            NeighborPts = NeighborPts joined with NeighborPts'
      if P' is not yet member of any cluster              //如果邻域内点不是核心点，并且无类别，比如噪音数据，则加入此类别
         add P' to cluster C
          
regionQuery(P, eps)                                       //计算邻域
   return all points within P's eps-neighborhood

结合百度百科的伪代码：

SummmerSnow

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
DBScan 算法

DBScan 是一种基于密度的聚类算法，主要算法流程如下图：DBSCAN(D, eps, MinPts) C = 0 //类别标示 for each unvisited point P in dataset D //遍历 mark P as visited
复制链接

扫一扫

专栏目录