K均值(K-means)聚类算法原理与代码详解

最新推荐文章于 2023-09-26 20:41:13 发布

。画地为牢。

最新推荐文章于 2023-09-26 20:41:13 发布

阅读量3.1k

点赞数 5

文章标签：聚类算法 python 机器学习

本文链接：https://blog.csdn.net/weixin_45837461/article/details/107046104

版权

本文详细介绍了K-means聚类算法的原理，包括数据初始化、质点选择、数据划分、质心计算等步骤，并提供了代码实现及运行结果。适合机器学习初学者了解和实践。

摘要由CSDN通过智能技术生成

0. 算法原理：

在这里插入图片描述
上述过程简单描述：
a: 初始数据
b: 选择质点
c: 根据质点划分
d: 求均值，更新质心点
e: 划分
f: 更新质心点

在这里插入图片描述

1. 代码实现：

# K means 教程

# 0. 引入依赖
import numpy as np
import matplotlib.pyplot as plt

# 从sklearn中直接生成聚类数据
from sklearn.datasets.samples_generator import make_blobs


# 1. 数据加载
x, y = make_blobs(n_samples = 100, centers = 6, random_state = 1234, cluster_std = 0.6)   
# make_blobs函数是为聚类产生数据集
# n_samples:表示数据样本点个数
# centers是聚类中心点的个数 可以理解为label的种类数
# random_state是随机种子，可以固定生成的数据
# cluster_std设置每个类别的方差
# print(x.shape) x为100 * 2 矩阵，横纵坐标
plt.figure(figsize = (6, 6))            # 设置画布大小
plt.scatter(x[:, 0],x[:, 1], c = y)