sklearn包中的K-Means算法

最新推荐文章于 2024-06-24 19:08:35 发布

热情的rhew

最新推荐文章于 2024-06-24 19:08:35 发布

阅读量2.6k

点赞数 2

分类专栏：建模文章标签： K-Means聚类

本文链接：https://blog.csdn.net/qq_33835370/article/details/90725679

版权

建模专栏收录该内容

2 篇文章 0 订阅

订阅专栏

1）函数：sklearn.cluster.KMeans

2）主要参数

n_clusters：要进行的分类的个数，即上文中k值，默认是8

max_iter ：最大迭代次数。默认300

min_iter ：最小迭代次数，默认10

init：有三个可选项

'k-means ++'：使用k-means++算法，默认选项

'random':从初始质心数据中随机选择k个观察值

第三个是数组形式的参数

n_jobs: 设置并行量（-1表示使用所有CPU）

3）主要属性：

cluster_centers_ ：集群中心的坐标

labels_ : 每个点的标签

4）官网示例：


>>> from sklearn.cluster import KMeans
>>> import numpy as np
>>> X = np.array([[1, 2], [1, 4], [1, 0],
...               [4, 2], [4, 4], [4, 0]])
>>> kmeans = KMeans(n_clusters=2, random_state=0).fit(X)
>>> kmeans.labels_
array([0, 0, 0, 1, 1, 1], dtype=int32)
>>> kmeans.predict([[0, 0], [4, 4]])
array([0, 1], dtype=int32)
>>> kmeans.cluster_centers_
array([[ 1.,  2.],
       [ 4.,  2.]])