K-Means算法详细介绍(SSE、轮廓分析)

最新推荐文章于 2024-05-18 12:25:51 发布

修炼之路

最新推荐文章于 2024-05-18 12:25:51 发布

阅读量4.3w

点赞数 16

分类专栏：机器学习 scikit-learn修炼之路 python机器学习实战文章标签： KMeans FCM 簇内误方差轮廓系数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_29957455/article/details/80113972

版权

python机器学习实战同时被 3 个专栏收录

43 篇文章 834 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

57 篇文章 20 订阅

订阅专栏

scikit-learn修炼之路

22 篇文章 3 订阅

订阅专栏

在前面我们介绍过了很多的监督学习算法，分类和回归。这篇文章主要介绍无监督算法，通过聚类分析来处理无类标数据。我们事先并不知道数据的正确结果(类标)，通过聚类算法来发现和挖掘数据本身的结构信息，对数据进行分簇(分类)。聚类算法的目标是，簇内相似度高，簇间相似度低。有点像LDA降维算法，类内方差最小，类间方差最大。这篇文章主要包括：

1、K-Means算法
2、K-Means++
3、硬聚类和软聚类
4、聚类算法的性能评价指标

一、K-Means算法

在聚类算法中K-Means算法是一种最流行的、使用最广泛的一种聚类算法，因为它的易于实现且计算效率也高。聚类算法的应用领域也是非常广泛的，包括不同类型的文档分类、音乐、电影、基于用户购买行为的分类、基于用户兴趣爱好来构建推荐系统等。

K-Means算法的实现步骤，主要分为四个步骤：

1、从样本集合中随机抽取k个样本点作为初始簇的中心。

2、将每个样本点划分到距离它最近的中心点所代表的簇中。

3、用各个簇中所有样本点的中心点代表簇的中心点。

4、重复2和3，直到簇的中心点不变或达到设定的迭代次数或达到设定的容错范围。

常用的距离度量标准是欧几里得距离的平方：

其中x和y表示不同的两个样本，n表示样本的维度(特征的数量)。基于欧几里得距离，K-Means算

了解本专栏

超级会员免费看

关注

16
点赞
踩
98

收藏

觉得还不错? 一键收藏
打赏
6
评论
K-Means算法详细介绍(SSE、轮廓分析)

在前面我们介绍过了很多的监督学习算法，分类和回归。这篇文章主要介绍无监督算法，通过聚类分析来处理无类标数据。我们事先并不知道数据的正确结果(类标)，通过聚类算法来发现和挖掘数据本身的结构信息，对数据进行分簇(分类)。聚类算法的目标是，簇内相似度高，簇间相似度低。有点像LDA降维算法，类内方差最小，类间方差最大。这篇文章主要包括：1、K-Means算法2、K-Means++3、硬聚类和软聚类4、聚类...
复制链接

扫一扫

专栏目录

评论 6

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

修炼之路 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。