【数学建模】-聚类模型学习笔记之基于密度的聚类算法DBSCAN算法

最新推荐文章于 2024-11-19 13:23:42 发布

勤奋努力的野指针

最新推荐文章于 2024-11-19 13:23:42 发布

阅读量1.4k

点赞数 4

分类专栏：数学建模文章标签：聚类算法学习

本文链接：https://blog.csdn.net/suolong1/article/details/124531325

版权

DBSCAN是一种基于密度的聚类算法，无需预先指定聚类数量，能处理任意形状簇并发现异常点。算法将点分为核心点、边界点和噪音点。虽然对参数选择敏感且计算复杂度高，但适合密度不均匀的数据集。文章提供了Matlab和Python代码示例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

学习来源：
清风老师
机器学习聚类算法之DBSCAN
DBSCAN聚类算法——机器学习（理论+图解+python代码
 DBSCAN 算法

基本概念

DBSCAN算法迭代可视化展示

DBSCAN是一种基于密度的聚类方法，聚类前不需要预先指定聚类的个数，生成的簇的个数不定（和数据有关）。该算法利用基于密度的聚类的概念，即要求聚类空间中的一定区域内所包含对象（点或其他空间对象）的数目不小于某一给定阈值。该方法能在具有噪声的空间数据库中发现任意形状的簇，可将密度足够大的相邻区域连接，能有效处理异常数据。

DBSCAN算法将数据点分为三类：
• 核心点：在半径Eps内含有不少于MinPts数目的点
• 边界点：在半径Eps内点的数量小于MinPts，但是落在核心
点的邻域内
• 噪音点：既不是核心点也不是边界点的点

在这里插入图片描述

Matlab代码

matlab代码
在这里插入图片描述

clc;
clear;
close all;

%% Load Data

load mydata;


%% Run DBSCAN Clustering Algorithm

epsilon=0.5;
MinPts=10;
IDX=DBSCAN(X,epsilon,MinPts);


%% Plot Results
% 如果只要两个指标的话就可以画图啦
PlotClusterinResult(X, IDX);
title(['DBSCAN Clustering (\epsilon = ' num2str(epsilon) ', MinPts = ' num2str(MinPts) ')']);

function [IDX, isnoise]=DBSCAN(X,epsilon,MinPts)

    C=0;
    
    n=size(X,1);
    IDX=zeros(n,1);  % 初始化全部为0，即全部为噪音点
    
    D=pdist2(X,X);
    
    visited=false(n,1);
    isnoise=false(n,1);
    
    for i=1:n
        if ~visited(i)
            visited(i)=true;
            
            Neighbors=RegionQuery(i);
            if numel(Neighbors)<<