机器学习10-k-means算法

猛男在线敲代码

于 2021-09-14 14:45:17 发布

阅读量132

点赞数

文章标签：算法机器学习自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43591530/article/details/120286090

版权

K-means算法

在这里插入图片描述
K-means主要由簇分配和移动聚类中心两部分组成，是一种迭代的算法，2个簇的流程可如下描述：

簇分配：随机选择两个样本点，作为簇中心，将每个样本划分至距离更近的簇中心，作为它所属的簇
移动聚类中心：分别计算两个簇中，属于这个簇所有样本的均值，将这个取平均后的向量位置作为当前簇新的中心
重新进行簇分配、移动聚类中心，不断迭代，直到聚类中心不再改变
用伪代码，可作如下描述：

在这里插入图片描述

优化目标函数

在这里插入图片描述

随机初始化

在这里插入图片描述
注：K-means聚类算法有时候会陷入局部最优解。

如下图所示：
在这里插入图片描述

K值（簇的数量）

簇的数量的选择，通常有两种方法，均要求 K< m ：

人工选择：根据需求或者已知的知识，进行人工选择簇的数量
肘部法则：如下图所示（图源：吴恩达机器学习），尝试不同的 K ，选择变化率明显变缓的“肘部点”
在这里插入图片描述

猛男在线敲代码

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习10-k-means算法

K-means算法K-means主要由簇分配和移动聚类中心两部分组成，是一种迭代的算法，2个簇的流程可如下描述：簇分配：随机选择两个样本点，作为簇中心，将每个样本划分至距离更近的簇中心，作为它所属的簇移动聚类中心：分别计算两个簇中，属于这个簇所有样本的均值，将这个取平均后的向量位置作为当前簇新的中心重新进行簇分配、移动聚类中心，不断迭代，直到聚类中心不再改变用伪代码，可作如下描述：优化目标函数随机初始化注：K-means聚类算法有时候会陷入局部最优解。如下图所示：K值（簇的数
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。