kmeans算法中的sse_吴恩达机器学习笔记（七） —— K-means算法

最新推荐文章于 2024-01-19 20:49:02 发布

日签君AIUX

最新推荐文章于 2024-01-19 20:49:02 发布

阅读量853

点赞数

文章标签： kmeans算法中的sse

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_30715739/article/details/114723228

版权

本文详细介绍了K-means算法，包括算法原理、过程、随机初始化和二分K-means策略。K-means是无监督学习中的聚类算法，其目标是最小化数据点与中心点的距离，即SSE。随机初始化会影响结果，二分K-means旨在解决这个问题。文章还探讨了K的选择，提出了Elbow method作为选择合适的k值的参考方法。

摘要由CSDN通过智能技术生成

主要内容：

一.K-means算法简介

二.算法过程

三.随机初始化

四.二分K-means

四.K的选择

一.K-means算法简介

1.K-means算法是一种无监督学习算法。所谓无监督式学习，就是输入样本中只有x，没有y，即只有特征，而没有标签，通过这些特征对数据进行整合等操作。而更细化一点地说，K-means算法属于聚类算法。所谓聚类算法，就是根据特征上的相似性，把数据聚集在一起，或者说分成几类。

2.K-means算法作为聚类算法的一种，其工作自然也是“将数据分成几类”，其基本思路是：

1) 首先选择好将数据分成k类，然后随机初始化k个点作为中心点。

2) 对于每一个数据点，选取与之距离最近的中心点作为自己的类别。

3) 当所有数据点都归类完毕后，调整中心点：把中心点重新设置为该类别中所有数据点的中心位置，每一轴都设置为平均值。(所以称为means)

4) 重复以上2)~3)步骤直至数据点的类别不再发生变化。

3.K-means算法从感性上去理解，就是把一堆靠得近的点归到同一个类别中。

二.算法过程

1.一些变量的约定：μ(i)表示第i个中心点，c(i)表示第i个数据点归到哪个中心点。

2.K-means算法的本质就是：移动中心点，使其渐渐地靠近数据的“中心”，即最小化数据点与中心点的距离。即：

3.算法流程：

4.Python代码如下：

1 #coding:utf-8

2

3 from numpy import *

4

5 def distEclud(vecA, vecB): #计算欧式距离

6 return sqrt(sum(power(vecA - v

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。