机器学习小组知识点34：K-means聚类

最新推荐文章于 2023-05-08 19:55:30 发布

Eric2016_Lv

最新推荐文章于 2023-05-08 19:55:30 发布

阅读量814

点赞数

分类专栏：机器学习算法数据挖掘文章标签：数据算法机器学习标签

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Eric2016_Lv/article/details/61198998

版权

本文介绍了K-means聚类算法，它是非监督学习的一种。算法目标是将数据集分成k类，通过迭代更新簇中心和分配样本到最近的簇。K-means算法具有快速、简单的优点，适用于大数据集，但对K值的选择和初始聚类中心敏感，可能导致局部最优。可以通过多次运行选取最佳结果。

摘要由CSDN通过智能技术生成

监督学习和非监督学习前情回顾：

在聚类问题中，给定一个训练集，算法根据某种策略将训练集分成若干类。在监督式学习中，训练集中每一个数据都有一个标签，但是在如果分类问题中没有标签，我们可以将聚类算法称之为非监督式学习算法。这两种算法最大的区别还在于：监督式学习有标签，而非监督式学习没有标签。那么这里可以理解为标签实际上就是一种监督性质的分类，而无标签根据分布性质，那么我们称之为聚类。感兴趣同学可以查阅半监督学习。

算法基本内容

算法的核心目标就是将给定的数据集分成 $k$ 类，具体做法为：

1、随机选取k个簇中心（cluster centroids）记为 $μ_1 ,μ_2 , ... ,μ_k ∈R^ n$

2、重复下面过程直到收敛 {
对于每一个样例 $i$ ，计算其应该属于的类
$c (i) = a r g m i n j ∥ x (i) - μ j ∥ 2$ $c^{(i)} = arg\ min_j\|x^{(i)}-\mu_j\|^2$
对于每一个类j，重新计算该类的质心

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习小组知识点34：K-means聚类

监督学习和非监督学习前情回顾：在聚类问题中，给定一个训练集，算法根据某种策略将训练集分成若干类。在监督式学习中，训练集中每一个数据都有一个标签，但是在如果分类问题中没有标签，我们可以将聚类算法称之为非监督式学习算法。这两种算法最大的区别还在于：监督式学习有标签，而非监督式学习没有标签。那么这里可以理解为标签实际上就是一种监督性质的分类，而无标签根据分布性质，那么我们称之为聚类。感兴趣同学可以查阅半监
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。