sklearn包中的K-Means算法

 1)函数:sklearn.cluster.KMeans

   2)主要参数

           n_clusters:要进行的分类的个数,即上文中k值,默认是8

           max_iter  :最大迭代次数。默认300

           min_iter   :最小迭代次数,默认10

           init:有三个可选项

                   'k-means ++':使用k-means++算法,默认选项

                   'random':从初始质心数据中随机选择k个观察值

                   第三个是数组形式的参数

            n_jobs: 设置并行量 (-1表示使用所有CPU)

     3)主要属性:

          cluster_centers_ :集群中心的坐标

          labels_ : 每个点的标签

      4)官网示例:  


>>> from sklearn.cluster import KMeans
>>> import numpy as np
>>> X = np.array([[1, 2], [1, 4], [1, 0],
...               [4, 2], [4, 4], [4, 0]])
>>> kmeans = KMeans(n_clusters=2, random_state=0).fit(X)
>>> kmeans.labels_
array([0, 0, 0, 1, 1, 1], dtype=int32)
>>> kmeans.predict([[0, 0], [4, 4]])
array([0, 1], dtype=int32)
>>> kmeans.cluster_centers_
array([[ 1.,  2.],
       [ 4.,  2.]])

 

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值