数据分析--kmeans算法

ro0Kie1224

已于 2023-10-19 19:40:45 修改

阅读量46

点赞数 1

文章标签：算法数据分析 kmeans

于 2023-10-19 19:37:56 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_61641927/article/details/133933346

版权

使用K-means算法进行数据聚类

已知数据集(dataforkmeans.txt)共有104个样本数据，每个样本数据包含两个特征x和y。要求对数据集进行以下聚类分析：

1、读取dataforkmeans.txt文件

2、利用散点图查看数据的分布

3、使用k均值对数据进行聚类：显示聚类结果、聚类中心点

4、使用散点图显示聚类结果

import numpy as np
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans

data = np.genfromtxt('dataforkmeans.txt', delimiter='      ')
data = data[~np.isnan(data).any(axis=1)]

x = data[:, 0]
y = data[:, 1]

plt.scatter(x, y)
plt.xlabel('Feature X')
plt.ylabel('Feature Y')
plt.title('Scatter Plot of Data')
plt.show()



# 定义要进行的聚类数量
k = 4

kmeans = KMeans(n_clusters=k)
kmeans.fit(data)

# 获取聚类标签
labels = kmeans.labels_

# 获取聚类中心点
cluster_centers = kmeans.cluster_centers_

print("Cluster Labels:", labels)
print("Cluster Centers:", cluster_centers)

plt.scatter(x, y, c=labels)
plt.scatter(cluster_centers[:, 0], cluster_centers[:, 1], c='red', marker='*', s=100)
plt.xlabel('Feature X')
plt.ylabel('Feature Y')
plt.title('K-means Clustering Results')
plt.show()

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

ro0Kie1224 CSDN认证博客专家 CSDN认证企业博客

码龄3年

1: 原创

169万+: 周排名

78万+: 总排名

45: 访问

: 等级

11: 积分

1: 粉丝

1: 获赞

1: 评论

0: 收藏

私信

关注

热门文章

数据分析--kmeans算法 46

最新评论

数据分析--kmeans算法
CSDN-Ada助手: 恭喜您开始博客创作！标题中的"kmeans算法"非常吸引人，我期待着阅读您的文章。对于数据分析领域来说，kmeans算法是一个非常重要的主题。在您的博客中，我希望能看到对kmeans算法的详细解释以及其在实际应用中的案例分析。此外，如果您能探讨一下kmeans算法的优缺点以及与其他聚类算法的比较，将会使您的博客更加丰富和有价值。谦虚的建议，希望能给您的创作提供一些启发。期待您的下一篇文章！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。