DBSCAN聚类算法的Python可视化

DBSCAN聚类实战

最新推荐文章于 2025-05-24 10:12:00 发布

原创

最新推荐文章于 2025-05-24 10:12:00 发布 · 2.6k 阅读

6 ·

CC 4.0 BY-SA版权

文章标签：

#python #算法 #聚类

DBSCAN全称为“Density-Based Spatial Clustering of Applications with Noise”。我们可以利用sklearn在python中实现DBSCAN。

首先，import相关的Library。

import numpy as np
import pandas as pd
import math
import matplotlib.pyplot as plt
import matplotlib
from sklearn.cluster import DBSCAN
from sklearn.neighbors import NearestNeighbors

我们首先定义一个function来创建我们需要的数据集，数据集的dimension为2。下图为我们将要创建的数据集的可视化。这个数据集由三个圆圈组成。在我们定义的function中，r代表半径，n代表点的数量。

在这里插入图片描述

np.random.seed(42)
def PointsInCircum(r,n=100):
    return [(math.cos(2*math.pi/n*x)*r+np.random.normal(-30,30),math.sin(2*math.pi/n*x)*r+np.random.normal(-30,30)) for x in range(1,n+1)]