K-means聚类算法筛实现鸢尾花聚类

最新推荐文章于 2023-11-01 21:36:33 发布

Mr.Harsh

最新推荐文章于 2023-11-01 21:36:33 发布

阅读量3k

点赞数 1

分类专栏：机器学习文章标签： K-means 聚类鸢尾花数据无监督学习 sklearn

本文链接：https://blog.csdn.net/qq_36831734/article/details/127805046

版权

机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

K-means聚类算法筛实现鸢尾花聚类:对于给定的样本集，按照样本之间的距离大小，将样本集划分为K个簇，让簇内的点尽量紧密的连在一起，而让簇间的距离尽量的。聚类属于无监督算法，不必专门切分训练集与测试集

导入包

import matplotlib.pyplot as plt
import numpy as np
from sklearn.cluster import KMeans 
from sklearn import datasets

sklearn.datasets中加载数据集

# 直接从sklearn中获取数据集
iris = datasets.load_iris()
X = iris.data[:, :4]    # 表示我们取特征空间中的4个维度
print(X.shape)

绘制二维数据分布图

# 取前两个维度（萼片长度、萼片宽度），绘制数据分布图
plt.scatter(X[:, 0], X[:, 1], c="red", marker='o', label='see')
plt.xlabel('sepal length')
plt.ylabel('sepal width')
plt.legend(loc=2)
plt.show()

实例化K-means类，并且定义训练函数

def Model(n_clusters):
    estimator = KMeans(n_clusters=n_clusters)# 构造聚类器
    return estimator

def train(estimator):
    estimator.fit(X)  # 聚类

训练

# 初始化实例，并开启训练拟合
estimator=Model(3)     
train(estimator)

可视化展示

label_pred = estimator.labels_  # 获取聚类标签
# 绘制k-means结果
x0 = X[label_pred == 0]
x1 = X[label_pred == 1]
x2 = X[label_pred == 2]
plt.scatter(x0[:, 0], x0[:, 1], c="red", marker='o', label='label0')
plt.scatter(x1[:, 0], x1[:, 1], c="green", marker='*', label='label1')
plt.scatter(x2[:, 0], x2[:, 1], c="blue", marker='+', label='label2')
plt.xlabel('sepal length')
plt.ylabel('sepal width')
plt.legend(loc=2)
plt.show()

Mr.Harsh

关注

1
点赞
踩
36

收藏

觉得还不错? 一键收藏
0
评论
K-means聚类算法筛实现鸢尾花聚类

def Model(n_clusters) : estimator = KMeans(n_clusters = n_clusters) # 构造聚类器 return estimator def train(estimator) : estimator . fit(X) # 聚类。
复制链接

扫一扫