kmeans

最新推荐文章于 2022-09-28 20:52:04 发布

我叫小王同学

最新推荐文章于 2022-09-28 20:52:04 发布

阅读量613

点赞数

分类专栏：优化算法文章标签：算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wenxuegeng/article/details/51492327

版权

优化算法专栏收录该内容

0 篇文章 0 订阅

订阅专栏

简介

kmeans聚类算法自1965年已经提出50多年，具有容易实施，简单，高效的优点，也有很多学者对kmeans算法进行改进，得到了很多优化策略。
kmeans是基于划分的聚类方法，将样本集组成的矢量空间划分成多个区域 ${S_i}_{i=1}^k$ ，每个区域都存在在一个区域相关的表示 ${c_i}_{i=1}^k$ ,通常称为区域中心，kmeans的目标是将数据集划分成k簇，使得划分后的k类子集合满足误差平方和最小（SSE），

J (s) = a r g m i n \sum \sum | | x - c i | | 22

$\begin{equation} J(s) = arg min \sum \sum||x - c_i || _2^2 \end{equation}$
其中

x $x$ 是空间中的点，表示给定的数据对象，

ci $c_i$ 是簇的形心，该公式即表示簇中的每个对象到簇中心距离的平方和。
更新聚类中心公式：

c t + 1 i = 1 | s t i | \sum x i

$\begin{equation} c_i^{t+1} = \frac{1}{|s_i^t|} \sum x_i \end{equation}$

经典算法

经典的kmeans算法作为无监督分类方法，需要预先知道要分的类数K，其算法流程如下：

算法k-means 用于聚类
输入：

k：簇的数目
D：包含n个对象的数据集

输出：

k个簇的集合

方法：

初始化k个对象作为簇中心
loop
分配各样本到相近的聚类集合中
更新聚类中心
until 聚类中心变化在允许误差内

复杂度分析

$t =（ t_{样本分配}+t_{更新聚类中心}）*k*t$
$t_{样本分配} = knd$ (d表示平方和)
$t_{更新聚类中心} = nd$

算法优化-Kmeans++

–待续

我叫小王同学

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
kmeans

kmeans聚类算法及改进
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。