1、导入数据
#导入花萼数据
from sklearn.datasets import load_iris
iris=load_iris()
iris.data
前四列为花萼长度,花萼宽度,花瓣长度,花瓣宽度等4个用于识别鸢尾花的属性
2、建模
#创建kmeans聚类
from sklearn.cluster import KMeans
kmeans=KMeans(n_clusters=3,init='k-means++',random_state=123) #分为三类
y_kmeans=kmeans.fit_predict(iris.data)
y_kmeans
可以看出0聚类得很好,但是2当中夹杂着1,1中夹杂着2,1和2存在混淆
3、可视化聚类模型
import matplotlib.pyplot as plt
#画出了三个类的中心点位置
plt.scatter(iris.data[y_kmeans==0,2],iris.data[y_kmeans==0,3],s=100,c='red',label='Cluter 1')
plt.scatter(iris.data[y_kmeans==1,2],iris.data[y_kmeans==1,3],s=100,c='blue',label='Cluter 2')