python kmeans

最新推荐文章于 2024-08-11 16:00:02 发布

Viola_mio

最新推荐文章于 2024-08-11 16:00:02 发布

阅读量287

点赞数

分类专栏： python cluster 文章标签： cluster kmeans sklearn

本文链接：https://blog.csdn.net/Viola_mio/article/details/80199483

版权

python 同时被 2 个专栏收录

3 篇文章 0 订阅

订阅专栏

cluster

1 篇文章 0 订阅

订阅专栏

sklearn官网documentation

http://scikit-learn.org/dev/modules/generated/sklearn.cluster.KMeans.html

# K-Means Algorithm
import numpy as np
from sklearn.cluster import KMeans

def loadData(file):
    tmp = np.loadtxt(file, dtype=np.str, delimiter=",")
    data = tmp[0:1514, 0:5].astype(np.float)  # load data
    return data

if __name__ == '__main__':
    handledData = loadData("handled300001.CSV")
    estimator = KMeans(n_clusters=2)
    estimator.fit_predict(handledData)# compute k-means clustering
    prelabel = estimator.labels_# labels
    centroids = estimator.cluster_centers_# centroids
    # inertia = estimator.inertia_# centroid sum

    res1 = []

    res2 = []# save the two component clusterings

    for items in range(len(handledData)):
        if (int(prelabel[items]) == 0):
            res1.append(handledData[items][0], handledData[items][1], handledData[items][2],\
                        handledData[items][3], handledData[items][4])
        elif (int(prelabel[items]) == 1):
            res2.append(handledData[items][0], handledData[items][1], handledData[items][2],\
                        handledData[items][3], handledData[items][4])

    print(prelabel, '\n', centroids)

我看官网的document，貌似sklearn的kmeans不能输出不能直接输出各个cluster 就补充了后面的res1和res2来分别存储两个cluster

Viola_mio

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录