k-means聚类后按标签大小顺序排列标签

最新推荐文章于 2023-01-06 13:35:49 发布

阳光下的沃土

最新推荐文章于 2023-01-06 13:35:49 发布

阅读量3k

点赞数 6

文章标签：数据挖掘

本文链接：https://blog.csdn.net/yangzhijun6699/article/details/113619282

版权

k-means聚类后按标签大小顺序排列标签

数据
目标
方法
代码
效果

数据

在这里插入图片描述

目标

为上面的学生分数，聚类成优、良、中、差、四类

方法

主要是聚类后，怎么把标签对应到原始数据中去，这里我们采用掩码的方式

代码

from sklearn.cluster import KMeans
import pandas as pd
data=pd.read_csv("kmeanstest.csv",sep=",")
print(data)

X =data["score"].to_numpy().reshape(-1,1)
kmeans = KMeans(n_clusters=4, random_state=0).fit(X)
y=kmeans.labels_
print(y)
kc=kmeans.cluster_centers_
print(kc)
kc_list=sorted([i for i in kc[:,0]])
print(kc_list)

data["cluster_center"]=kc[y]
def my(x):
    if x==kc_list[0]:
        return "差"
    elif x==kc_list[1]:
        return "中"
    elif x==kc_list[2]:
        return "良"
    else:
        return "优"
data["level"]=[my(x) for x in kc[y]]
print(data)