Kmeans与DBSCAN聚类结果演示

最新推荐文章于 2024-07-19 08:15:00 发布

qq_27481087

最新推荐文章于 2024-07-19 08:15:00 发布

阅读量672

点赞数

文章标签：聚类 python 数据可视化

本文链接：https://blog.csdn.net/qq_27481087/article/details/107622400

版权

import pandas as pd

# 读取数据
data = pd.read_excel('./演示数据.xlsx')

data.head()

在这里插入图片描述

# 绘制图形
import matplotlib.pyplot as plt
plt.scatter(data.iloc[:, 0], data.iloc[:, 1], c='green', marker='^')
plt.xlabel('x')
plt.ylabel('y')
plt.show()

在这里插入图片描述

# 使用DBSCAN算法进行聚类
from sklearn.cluster import DBSCAN
dbs = DBSCAN()
dbs.fit(data)
label_dbs = dbs.labels_
label_dbs

array([0, 0, 1, 0, 1, 0, 1, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 1, 1, 0,
1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 0, 1, 1, 1, 0, 1, 0, 0, 0, 1, 0, 1,
0, 1, 0, 0, 1, 0, 1, 0, 0, 1, 0, 0, 0, 1, 1, 1, 0, 1, 1, 0, 0, 0,
0, 0, 1, 1, 0, 0, 0, 1, 1, 1, 1, 1, 1, 0, 1, 0, 0, 1, 0, 0, 1, 0,
1, 1, 1, 1, 0, 1, 1, 1, 0, 1, 1, 0], dtype=int64)

# 展示聚类后的结果
plt.scatter(data[label_dbs==0].iloc[:, 0], data[label_dbs==0].iloc[:, 1], c='red', marker='o', label='class0', s=80)
plt.scatter(data[label_dbs==1].iloc[:, 0], data[label_dbs==1].iloc[:, 1], c='green', marker='*', label='class1', s=80)
plt.legend(loc='lower right')
plt.show()

在这里插入图片描述

# Kmeans算法和DBSCAN算法对比
from sklearn.cluster import KMeans
kms = KMeans(n_clusters=2)
kms.fit(data)
label_kms = kms.labels_
label_kms

array([1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 1, 0, 1, 1, 0, 0, 0,
0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 1, 0, 0, 0, 1, 0, 0, 1, 0, 1, 0, 0,
1, 0, 1, 0, 0, 1, 0, 0, 0, 0, 1, 1, 0, 0, 0, 1, 1, 0, 0, 1, 0, 0,
0, 1, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 0, 1,
0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0])

# 展示聚类后的结果
plt.scatter(data[label_kms==0].iloc[:, 0], data[label_kms==0].iloc[:, 1], c='red', marker='o', label='class0', s=80)
plt.scatter(data[label_kms==1].iloc[:, 0], data[label_kms==1].iloc[:, 1], c='green', marker='*', label='class1', s=80)
plt.legend(loc='lower right')
plt.show()

在这里插入图片描述