聚类常见算法K-means & DBSCAN

本文详细介绍了K-means和DBSCAN两种聚类算法的实践过程。首先,通过K-means算法进行数据分类,包括数据读取、选择特征、分类、排序、可视化及计算不同类别特征的中心。接着,讨论了数据标准化对K-means的影响,并评估了分类结果的轮廓系数。随后,运用DBSCAN算法进行聚类,分析了不同参数下聚类效果,并进行了可视化展示。最后,探讨了数据标准化后DBSCAN的分类结果。
摘要由CSDN通过智能技术生成

一.K-means Clustering

1.读取数据

import pandas as pd
beer = pd.read_csv('data.txt', sep=' ')
beer

这里写图片描述
2.只取有用的四列数据

X = beer[["calories","sodium","alcohol","cost"]]
X.head()

这里写图片描述
3.使用Kmeans对X进行分类

from sklearn.cluster import KMeans

km = KMeans(n_clusters=3).fit(X)
km2 = KMeans(n_clusters=2).fit(X)
km.labels_

这里写图片描述
4.根据分类来排序

beer['cluster'] = km.labels_
beer['cluster2'] = km2.labels_
beer.sort_values('cluster')

这里写图片描述
5.cluster=3的平均值

beer.groupby("cluster").mean()

这里写图片描述
6.cluster=2的平均值

beer.groupby("cluster2").mean()

这里写图片描述
7.reset_index

centers = beer
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值