from sklearn import datasets
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
import pandas as pd
df=pd.read_csv('iris.csv')
#加载数据集
lris_df = datasets.load_iris()
#挑选出前两个维度作为x轴和y轴
#聚类前
x_axis = lris_df.data[:,0]
y_axis = lris_df.data[:,2]
plt.scatter(x_axis, y_axis)
plt.show()
#这里已经知道了分3类,其他分类这里的参数需要调试
model = KMeans(n_clusters=5)
#训练模型
model.fit(lris_df.data)
#选取行标为100的那条数据,进行预测
prddicted_label= model.predict([[6.3, 3.3, 6, 2.5]])
#预测全部150条数据
all_predictions = model.predict(lris_df.data)
#打印出来对150条数据的聚类散点图
#聚类后
plt.scatter(x_axis, y_axis, c=all_predictions)
plt.show()
聚类分析(k均值聚类)
最新推荐文章于 2024-10-20 21:33:37 发布
本文通过使用Python的sklearn库实现K-means算法对Iris数据集进行聚类分析,并可视化聚类结果。
1730

被折叠的 条评论
为什么被折叠?



