K-means代码示例-Python

最新推荐文章于 2024-07-31 14:30:10 发布

星途*

最新推荐文章于 2024-07-31 14:30:10 发布

阅读量252

点赞数

分类专栏： Python 文章标签： python kmeans 聚类

本文链接：https://blog.csdn.net/weixin_55798278/article/details/130802164

版权

Python 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

什么是K-means？

K-means是一种聚类算法，它通过将数据集分成K个簇来聚类数据。在K-means算法中，每个簇由其质心（即簇中所有点的平均值）表示，算法通过迭代优化簇的质心来聚类数据。

K-means算法的步骤如下：

随机选择K个质心。
将每个数据点分配到最近的质心所在的簇。
计算每个簇的新质心。
重复步骤2和3，直到质心不再改变或达到最大迭代次数。

K-means算法中的K代表簇的数量，通常需要事先设定好。K的选择对聚类结果有重要影响。另外，K-means算法对初始质心的选择敏感，不同的质心可能会导致不同的聚类结果。

代码示例：

from sklearn.cluster import KMeans
import numpy as np
import matplotlib.pyplot as plt

# 生成随机数据
data = np.random.rand(200, 2)

# 初始化KMeans模型，指定聚类数为4
kmeans = KMeans(n_clusters=4)

# 训练模型并预测聚类结果
labels = kmeans.fit_predict(data)

# 可视化聚类结果
plt.scatter(data[:, 0], data[:, 1], c=labels)
plt.scatter(kmeans.cluster_centers_[:, 0], kmeans.cluster_centers_[:, 1], marker='*', s=200, c='r')
plt.show()