聚类算法(二):DBSCAN算法

本文介绍了DBSCAN,一种基于密度的聚类算法。通过选择未访问对象,检查其e-邻域包含的点数来发现簇。当e-邻域包含至少MinPts个点时,创建新的簇并迭代地添加符合条件的对象。最后,当无法再扩充簇时,输出生成的簇。文章还提供了Python源码实现。
摘要由CSDN通过智能技术生成

首先确保你在动手写代码之前已经了解什么是聚类分析。

DBSCAN算法----一种基于密度的聚类算法。DBSCAN算法是如何发现簇的呢?


1.首先,给定数据集D中的所有对象都被标记为unvisited

2.随机的选择一个未访问的对象p,标记为visited

3.检查p的e-邻域是否至少包含MinPts个点

4.如果不是则标记为噪声点,否则为p创建一个簇C,并且把p的e-邻域中的所有对象都放到候选集合N中

5.DBSCAN迭代的把N中不属于其它簇的对象添加到C中。在此过程中,对于N中标记为unvisited的对象p‘,DBSCAN把它标记为visited,并检查它的e-邻域对象。

6.如果p’的e-邻域至少有MinPts个对象,则p‘的e-邻域中的对象全部添加到N中

7.DBSCAN继续添加对象到C中,知道C不能再被扩充位置,至此N就空了。此时簇C被生成,于是被输出


源码(Python)

import random
import math
import copy

def DBSCAN(data, e, MinPts):
    visited = []  # 已访问的成员
    C = []   # 一个新的簇C
    cluster = []
    unvisited = copy.deepcopy(data)  # 对所有对象标记为unvisited
    while unvisited != []:  # 如果还有未被探索的点则继续循环
        mark = random.randint(0, len(unvisited)-1)
        p = unvisited[mark]  # 在
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值