聚类常见算法K-means & DBSCAN

最新推荐文章于 2023-03-03 15:36:31 发布

Miss ❥ Ma

最新推荐文章于 2023-03-03 15:36:31 发布

阅读量622

点赞数

分类专栏：机器学习文章标签： k_means & DBSCAN 实践

本文链接：https://blog.csdn.net/TOMBOY_Marry/article/details/82594646

版权

本文详细介绍了K-means和DBSCAN两种聚类算法的实践过程。首先，通过K-means算法进行数据分类，包括数据读取、选择特征、分类、排序、可视化及计算不同类别特征的中心。接着，讨论了数据标准化对K-means的影响，并评估了分类结果的轮廓系数。随后，运用DBSCAN算法进行聚类，分析了不同参数下聚类效果，并进行了可视化展示。最后，探讨了数据标准化后DBSCAN的分类结果。

摘要由CSDN通过智能技术生成

一.K-means Clustering

1.读取数据

import pandas as pd
beer = pd.read_csv('data.txt', sep=' ')
beer

这里写图片描述
2.只取有用的四列数据

X = beer[["calories","sodium","alcohol","cost"]]
X.head()

这里写图片描述
3.使用Kmeans对X进行分类

from sklearn.cluster import KMeans

km = KMeans(n_clusters=3).fit(X)
km2 = KMeans(n_clusters=2).fit(X)
km.labels_

这里写图片描述
4.根据分类来排序

beer['cluster'] = km.labels_
beer['cluster2'] = km2.labels_
beer.sort_values('cluster')

这里写图片描述
5.cluster=3的平均值

beer.groupby("cluster").mean()

这里写图片描述
6.cluster=2的平均值

beer.groupby("cluster2").mean()

这里写图片描述
7.reset_index

centers = beer

最低0.47元/天解锁文章

Miss ❥ Ma

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录