聚类算法~无监督学习

最新推荐文章于 2024-07-06 19:10:32 发布

「已注销」

最新推荐文章于 2024-07-06 19:10:32 发布

阅读量372

点赞数

分类专栏：机器学习文章标签：聚类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fatfairyyy/article/details/115281257

版权

无监督学习中，聚类算法如K-Means用于寻找数据内在结构。K-Means算法包括随机初始化聚类中心、迭代调整直至稳定。优化目标是使得样本点到所属聚类中心的平方距离之和最小。选取合适的聚类个数K通常依赖于肘部法则等直观方法。

摘要由CSDN通过智能技术生成

什么是无监督学习？

先来看看什么是监督学习，一个典型的监督学习例子：

👆一个带有标签的训练集，我们的目标是，找到一条能够区分正样本和负样本的决策边界。在监督学习中，我们有一系列的标签，然后我们需要用假设函数来拟合它。作为对比，在无监督学习中，我们的数据并不带有任何的标签，我们得到的数据是这样的👇：

数据集可直接表示为 x⁽¹⁾,x⁽²⁾…,x⁽ⁿ⁾，没有y标签。
对于这些数据，我们能做的就是在它们中间找到一些结构，而对于这个训练集，通过无监督学习可以将它分成两个簇，成为聚类算法（Clustering algorithm）👇。

K-Means算法

假设我们有一个无标签的数据集，如下图所示，我们希望将它分为两个簇，使用K-Means聚类算法，步骤如下：👇
〇未使用K-Means聚类算法的原数据集。

①第一步是随即生成两点，这两点就叫做聚类中心(Cluster Centroids)，生成两个聚类中心，是因为我们现在希望将数据集分为两个簇👇。

②K-Means算法是一个迭代算法，它做两件事，第一步是簇分配（Cluster assignment），而第二步是移动聚类中心（Move centroid）。对于第一步而言，簇分配，是在内循环中遍历每一个数据样本点，也就是上图中的绿点，来给它们分配聚类中心（即上图中的红叉和蓝叉，分配依据是绿点距离红/蓝叉谁更近）。之后根据分配结果，将绿叉染成红色或蓝色。

内循环的第二步，即是移动聚类中心，我们要做的就是将红叉和蓝叉（即聚类中心）移动到红点和蓝点的均值处。我们要做的就是找出所有的红点，计算它们的均值，即所有红点的平均位置，然后把红色的聚类中心移动到那里。对于蓝色聚类中心，我们也要做同样的事情。

最低0.47元/天解锁文章

「已注销」

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
聚类算法~无监督学习

什么是无监督学习？先来看看什么是监督学习，一个典型的监督学习例子：????一个带有标签的训练集，我们的目标是，找到一条能够区分正样本和负样本的决策边界。在监督学习中，我们有一系列的标签，然后我们需要用假设函数来拟合它。作为对比，在无监督学习中，我们的数据并不带有任何的标签，我们得到的数据是这样的????：数据集可直接表示为 x(1),x(2)…,x(n)，没有y标签。对于这些数据，我们能做的就是在它们中间找到一些结构，而对于这个训练集，通过无监督学习可以将它分成两个簇，成为聚类算法（Clus
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。