python 聚类_【读书笔记】DBSCAN聚类Python程序及轮廓系数

最新推荐文章于 2023-03-26 09:14:01 发布

weixin_39540271

最新推荐文章于 2023-03-26 09:14:01 发布

阅读量741

点赞数

文章标签： python 聚类 python聚类平均聚类系数聚类结果不好怎么办

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39540271/article/details/111293436

版权

DBSCAN聚类Python程序及评价轮廓系数

import pandas aspd

beer =pd.read_csv('C:/Users/zhao/Desktop/data.txt', sep=' ') # 导入数据

print(beer)

fromsklearn.cluster import DBSCAN

X =beer[["colories","sodium","alcohol","cost"]]

db =DBSCAN(eps=10, min_samples=2).fit(X) # 设置半径为10，最小样本量为2，建模

labels =db.labels_ # 聚类，将每个实例的簇标签放入labels序列

beer['cluster_db']= labels # 在数据集最后一列加上经过DBSCAN聚类后的结果

beer.sort_values('cluster_db')

print(beer.groupby('cluster_db').mean()) # 查看根据DBSCAN聚类后的分组统计结果(均值)

print(pd.plotting.scatter_matrix(X,c=beer.cluster_db.tolist(), figsize = (10,10), s=100)) # 画出在不同两个指标下样本的分布情况

# 可以从这个图里观察聚类效果的好坏，但是当数据量很大，或者指标很多

最低0.47元/天解锁文章

weixin_39540271

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python 聚类_【读书笔记】DBSCAN聚类Python程序及轮廓系数

DBSCAN聚类Python程序及评价轮廓系数import pandas aspdbeer =pd.read_csv('C:/Users/zhao/Desktop/data.txt', sep=' ') # 导入数据print(beer)fromsklearn.cluster import DBSCANX =beer[["colories","sodium","alcohol"...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。