Ⅰ.原始数据
i.i.训练集
i.ii.测试集
Ⅱ.python程序
import pandas as pd
import numpy as np
from sklearn.cluster import KMeans
data=pd.read_excel('数据.xlsx',sheet_name='Sheet3')
x=np.array(data.iloc[:,1:]).T
kmeans=KMeans(n_clusters=3,random_state=0).fit(x)
category=data.columns[1:]
print('将训练集指标划分为3类:')
for i in range(len(category)):
print(category[i],kmeans.labels_[i])
data2=pd.read_excel('数据.xlsx',sheet_name='Sheet4')
x_predict=np.array(data2.iloc[:,1:]).T
pre=kmeans.predict(x_predict)
print('按照训练集的聚类规则,测试集的预测结果为:')
category2=data2.columns[1:]
for i in range(len(category2)):
print(category2[i],pre[i])
Ⅲ.结果
将训练集指标划分为3类:
芹菜 2
油菜 0
黄瓜 0
萝卜 0
茄子 2
西红柿 2
土豆 0
胡萝卜 0
青椒 2
尖椒 1
豆角 1
韭菜 2
豆腐 0
按照训练集的聚类规则,测试集的预测结果为:
鸡蛋 1
菜籽油 1
大豆油 1
花生油 1
芦柑 2
苹果 1
香蕉 2
西瓜 0
食用盐 0
绵白糖 1
白砂糖 1
红糖 1
酱油 1
醋 2
鲜牛奶 2