K-means聚类

最新推荐文章于 2022-07-20 12:05:40 发布

yzheately

最新推荐文章于 2022-07-20 12:05:40 发布

阅读量621

点赞数 1

分类专栏：机器学习打基础

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yzheately/article/details/51148594

版权

机器学习同时被 2 个专栏收录

34 篇文章 2 订阅

订阅专栏

33 篇文章 0 订阅

订阅专栏

参考 http://www.cnblogs.com/jerrylead

聚类就是将样本{ $x_1,x_2,...x_n$ }按照属性分类，注意这里样本的表已经不再是(x,y)了，现在只有属性x，因此聚类属于非监督学习法。

K-means聚类，就是将样本分为k类，其思想是：
1、先随机选择k个聚类中心（即随机选择k个样本）
2、将每个样本划分到与它距离最小的中心所属类别
3、根据2划分的结果重新计算k个聚类中心（每个类别中所有样本的均值）转到2，直至收敛

算法描述如下：
这里写图片描述

上面k表示我们要将样本分为k类，我们有k个聚类中心， $\mu_j$ 代表第当前迭代中的j个聚类中心。
这里写图片描述
上图是2个聚类中心的情况，a是原始样本，b中随机选择了两个聚类中心（这里并没有选取样本来初始化，而是任意选择了两个点），cdef是每次迭代逐渐收敛的过程。

下面我们来看看，k-means是否收敛，定义畸变函数：

J (c, μ) = \sum i = 1 m | | x (i) - μ c (i) | | 2

$J(c,\mu)=\sum_{i=1}^m||x^{(i)}-\mu_{c^{(i)}}||^2$
可以看出

J $J$ 就是每个类别中所有样本

x(i) $x^{(i)}$ 到聚类中心

μc(i) $\mu_{c^{(i)}}$ 的方差和。从上面聚类的算法可以看出，整个算法必然导致

J $J$ 越来越小，这说明

μ,c $\mu,c$ 是收敛的。

由于畸变函数 J 是非凸函数，意味着我们不能保证取得的最小值是全局最小值，也就是说 k-means 对质心初始位置的选取比较感冒，但一般情况下 k-means 达到的局部最优已经满足需求。但如果你怕陷入局部最优，那么可以选取不同的初始值跑多遍 k-means，然后取其中使得 $J(c,\mu)$ ，以该 $\mu$ 作为初始化的聚类中心，最终得到聚类中心c。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
K-means聚类

参考 http://www.cnblogs.com/jerrylead聚类就是将样本{x1,x2,...xnx_1,x_2,...x_n}按照属性分类，注意这里样本的表已经不再是(x,y)了，现在只有属性x，因此聚类属于非监督学习法。K-means聚类，就是将样本分为k类，其思想是： 1、先随机选择k个聚类中心（即随机选择k个样本） 2、将每个样本划分到与它距离最小的中心所属类别 3、根据2
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。