机器学习： K-means 聚类

最新推荐文章于 2023-05-26 20:55:48 发布

weixin_30887919

最新推荐文章于 2023-05-26 20:55:48 发布

阅读量125

点赞数

文章标签：人工智能

原文链接：http://www.cnblogs.com/mtcnn/p/9412103.html

版权

今天介绍机器学习里常见的一种无监督聚类算法，K-means。我们先来考虑在一个高维空间的一组数据集，S={x1,x2,...,xN}， x∈RD，假设我们需要把这组数据聚集长 K 类，不失一般性，我们可以假设每个聚好的类都有一个中心 μk，如果聚类完成的话，那么数据集中的每一个点 x 会有一个中心 μk 离这个点的距离最近。可以构造一个变量 rnk={0,1} 表示变量 x 离第 k 类最近 rnk=1，离其他的类更远 rnj=0,j≠k，那么我们可以定义如下的目标函数：

J = \sum n = 1 N \sum k = 1 K r n k | | x n - μ k | | 2

这个目标函数就是要求 rnk,μk，使得目标函数 J 的值最小。

为了解决上面这个问题，因为要同时求 rnk,μk 两个变量，所以我们会采取分步迭代的方法，当我们求 rnk 可以让 μk 固定不动，当我们求 μk 的时候，可以让 rnk 固定不动。

很显然，当我们求 rnk，只有比较每一个 xn 与 μk 的距离，选择距离最近的一个类即可:

r n k = 1 if = arg m i n j | | x n - μ j | | 2

而求 μk 的时候，我们可以让 rnk 固定不动，对目标函数 J 求导，

2 \sum n = 1 N r n k (x n - μ k) = 0

从而我们可以求得 μk :

μ k = \sum n r n k x n \sum n r n k

通过这样的反复迭代，直到所有的 rnk,μk 都不再变化。

转载于:https://www.cnblogs.com/mtcnn/p/9412103.html

weixin_30887919

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习： K-means 聚类

今天介绍机器学习里常见的一种无监督聚类算法，K-means。我们先来考虑在一个高维空间的一组数据集，S={x1,x2,...,xN}S={x1,x2,...,xN}， x∈RDx∈RD，假设我们需要把这组数据聚集长 KK 类，不失一般性，我们可以假设每个聚好的类都有一个中心 μkμk，如果聚类完成的话，那么数据集中的每一个点 xx 会有一个中心 μkμk 离这个...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。