本文对已经预处理的数据做聚类,数据保存在csv文件当中。所用数据见下图,第一行代表特征名称,接下来每一行代表一个样本,这里展示了15个特征和7条样本:
首先,我们需要读入数据:
import pandas as pd #这里我们使用pandas中的read_csv读入数据
data=pd.read_csv(file_name)
接着我们初始化聚类器,并训练数据:
from sklearn.cluster import KMeans #调用sklearn.cluster下面的KMeans聚类器
kmeans=KMeans(n_clusters=2) #初始化KMeans聚类器,参数n_clusters代表所要聚类数目
kmeans.fit(data) #导入数据训练聚类器
结果展示:
r=pd.concat([data,pd.Series(kmeans.labels_,index=data.index)],axis=1) #kmeans.labels_获得结果标签