【Educoder】— 机器学习（聚类第二关）

鹿毅十川

已于 2023-03-28 15:00:56 修改

阅读量1.3k

点赞数 3

分类专栏：【Educoder】头歌学习记录（持续学习更新）文章标签：聚类机器学习算法

于 2023-03-28 15:00:08 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_51023388/article/details/129816112

版权

【Educoder】头歌学习记录（持续学习更新）专栏收录该内容

6 篇文章 13 订阅

订阅专栏

目录

第二关—主要算法之K-Means 聚类

任务描述

本关任务：使用python语言编程，按要求完成任务。

相关知识

随着聚类分析技术的蓬勃发展，目前已有很多类型的聚类算法。但很难对聚类方法进行简单的分类，因为这些类别的聚类可能重叠，从而使得一种方法具有一些交叉的特征。一般而言，聚类算法被划分为以下几类：基于划分的方法；基于层次的方法；基于密度的方法；局域网格的方法。聚类分析中最广泛使用的算法为 K-Means 聚类算法。这里对 K-Means 聚类算法及其改进算法进行介绍。

K-Means聚类

原理

K-Means 算法的基本思想是初始随机给定 K 个聚类中心，按照最邻近原则把待分类样本点分到各个类。然后按平均法重新计算各个类的聚类中心，从而确定新的聚类中心。一直迭代，直到聚类中心保持不变或移动距离小于某个给定的值。
步骤

用于划分的 K-Means 算法，其中每个簇的中心都用簇中所有对象的均值来表示。K-Means 聚类模型所采用的迭代算法直观易懂且非常实用。但是具有容易收敛到局部最优解和需要预先设定簇的数量的缺陷。
K-means++算法
原理

将经典 K-Means 算法的 step 1 初始化类中心更改为： a）使用随机方法选取第一个（n=1）聚类中心； b）选取第 n+1 个聚类中心（0<n<K）时：距离当前 n 个聚类中心越远的点会有更高的概率被选为第 n+1 个聚类中心。
buzh

编程要求

根据提示，在右侧编辑器Begin-End部分补充代码。

任务描述：使用Python语言，对给定数据进行聚类，数据可视化如下：

创建 KMeans 对象，令 n_clusters=2；提示：可以使用 sklearn.cluster 中的 KMeans 模型。
调用 fit 函数执行训练过程。

调用 predict 函数进行预测，预测的数据为 [0,0], [8,2], [10,3]。

# 从 sklearn.cluster 导入 KMeans
from sklearn.cluster import KMeans
import numpy as np

# 加载数据集
X = np.array([[1, 2], [2, 2.2], [3, 1.5], [2, 1.8], [1, 1.4], [1, 2.5], [1, 1], [10, 2], [10, 2.5], [9, 2.3], [10, 2.4], [9.5, 2.1]])

# 任务1：创建 KMeans 对象，令 n_clusters=2
########## Begin ##########
kmeans = KMeans(n_clusters=2, random_state=0)
##########  End  ##########

# 任务2：调用 fit 函数执行训练过程
########## Begin ##########
kmeans = kmeans.fit(X)
##########  End  ##########

# 任务3：调用 predict 函数进行预测，预测的数据为 [0,0], [8,2], [10,3]
########## Begin ##########
y_pred = kmeans.predict([[0,0], [8,2], [10,3]])
##########  End  ##########

# 打印结果
print(y_pred)

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
打赏
0
评论
【Educoder】— 机器学习（聚类第二关）

第二关—主要算法之K-Means 聚类。
复制链接

扫一扫

专栏目录

鹿毅十川 CSDN认证博客专家 CSDN认证企业博客

码龄4年

12: 原创

3万+: 周排名

211万+: 总排名

1万+: 访问

: 等级

153: 积分

2410: 粉丝

23: 获赞

5: 评论

101: 收藏

私信

关注

热门文章

分类专栏

【Educoder】头歌学习记录（持续学习更新） 6篇

最新评论

【Educoder】— 机器学习（PCA第二关）
2401_83309724: 测试数据是一样的，但它的标准答案是[[-0.28587469 -2.12771028 1.9040097 ] [-0.82898877 -9.85279717 4.85840667]] ，真头大
【Educoder】— 机器学习（PCA第二关）
2401_83309724: 你好，我头歌上的标准答案和这个不一样是怎么回事
【Educoder】— 机器学习（PCA第一关）
CSDN-Ada助手: 非常棒的文章！感谢您分享有关PCA的机器学习知识。对于下一篇博客，我们建议您可以探讨一下主题：深度学习中的卷积神经网络（CNN）应用。这是一个热门且非常实用的主题，希望您能够分享更多的经验和见解。期待您的下一篇博客！ 2023年博客之星「城市赛道」年中评选已开启（https://activity.csdn.net/creatActivity?id=10470&utm_source=blog_comment_city ），博主的原力值在所在城市已经名列前茅，持续创作就有机会成为所在城市的 TOP1 博主（https://bbs.csdn.net/forums/blogstar2023?typeId=3152981&utm_source=blog_comment_city），更有丰厚奖品等你来拿~。
数据探索与数据预处理
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
python数据可视化，matplotlib画折线图，组合图
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

鹿毅十川 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。