## 密度聚类算法（DBSCAN）的python实现，以及参数epsilon和MinPts对聚类对聚类效果的影响

最新推荐文章于 2024-07-05 15:07:25 发布

freesouls small geng

最新推荐文章于 2024-07-05 15:07:25 发布

阅读量3.2k

点赞数 1

分类专栏：聚类算法中 K均值聚类（KMeans）的python实现文章标签：聚类算法 python 大数据

本文链接：https://blog.csdn.net/weixin_44925720/article/details/102313334

版权

本文介绍了DBSCAN聚类算法的Python实现，并探讨了参数epsilon和MinPts如何影响聚类效果。随着epsilon增大，核心样本点数量增加，但过度增长会导致所有点归为同一类别；而MinPts增大，核心样本点要求更高，导致ARI和核心样本数量下降。

摘要由CSDN通过智能技术生成

密度聚类算法（DBSCAN）的python实现，以及参数epsilon和MinPts对聚类对聚类效果的影响

首先，我们给出DBSCAN的python实现代码：

import numpy as np
import matplotlib.pyplot as plt
from sklearn.datasets.samples_generator import make_blobs
from sklearn import cluster
from sklearn.metrics import adjusted_rand_score
from sklearn import mixture

"""产生聚类数据"""
def creat_data(centers,num=100,std=0.7):#center聚类中心数组，std,每个族中的标准差
    x,labels_true=make_blobs(n_samples=num,centers=centers,cluster_std=std)
    return x,labels_true  #x为样本，labes为样本点的真实族分类标记

def DBSCAN(*data):
    x,labels_value=data
    clst=cluster.DBSCAN()
    predicted_labels=clst.fit_predict(x)#训练并预测每个样本所属的族标记
    print("ARI:%s"% adjusted_rand_score(labels_value,predicted_labels))#输出ARI指标
    print("core samble num:%d"%len(clst.core_sample_indices_))  #原始数据集被划分为簇的个数
#调用DBSCAN()函数，观察结果
centers=

最低0.47元/天解锁文章

freesouls small geng

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
0
评论
## 密度聚类算法（DBSCAN）的python实现，以及参数epsilon和MinPts对聚类对聚类效果的影响

密度聚类算法（DBSCAN）的python实现，以及参数epsilon和MinPts对聚类对聚类效果的影响首先，我们给出DBSCAN的python实现代码：import numpy as npimport matplotlib.pyplot as pltfrom sklearn.datasets.samples_generator import make_blobsfrom sklear...
复制链接

扫一扫