k-均值

最新推荐文章于 2022-06-30 20:09:44 发布

Diehard_Yin

最新推荐文章于 2022-06-30 20:09:44 发布

阅读量973

点赞数

分类专栏：机器学习文章标签：聚类算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yinlili2010/article/details/40616649

版权

机器学习专栏收录该内容

17 篇文章 0 订阅

订阅专栏

一、k-均值算法

点分配聚类算法中最著名的一个称为k-均值算法。该算法假设在欧式空间下，并假设最终簇的数目k事先已知。

3.1 k-均值算法的基础

代表簇的k个初始点选择有多种方法。在算法的核心for循环中，我们将k个初始点之外的每个点就近分配给最近（离簇的质心最近）的簇。需要注意的是当新的点分配到一个簇之后，质心可能会漂移。但是由于只有簇附近的点才可能会被分配给自己，所以簇的质心也不会移动太大。算法描述如下：

Initially choose k points that are likely to be in different clusters;

Make these points the centroids of their clusters;

For each remaining point p DO:

Find the centroid to which p is closest;

Add p to the cluster of that centroid;

Adjust the centroid of that cluster to account for p;

END;

算法的一个变形是固定所有簇的质心，然后将包含k个初始点的所有点重新分配到这k个簇中。

k-均值选择K的个数依靠可视化数据和实际的需要手工决定K，随机选择μ1,,...μk即初始的K个簇心centeroid。

如何优化随机化选择K个簇心：

1：如果K∈(2,10)，运行100次左右的随机化过程，然后计算每一次运行的cost函数:也叫Distortion Function.

min J(C1,...Cm, μ1,...μk) = 1/m* sum(||xi - μci||^2)

For each remaining point p DO: （x1到xm）

Find the centroid to which p is closest; (cp = k）

Add p to the cluster of that centroid; (add xp)

ADD STEP TO GET J: ||xp - μk||^2

Adjust the centroid of that cluster to account for p; (调整uk)

END;

J = 1/m* sum();

2：如果k特别的多，进行多次随机化过程没有太多的用处。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
k-均值

一、k-均值算法点分配聚类算法中最著名的一个称为k-均值算法。该算法假设在欧式空间下，并假设最终簇的数目k事先已知。3.1 k-均值算法的基础代表簇的k个初始点选择有多种方法。在算法的核心for循环中，我们将k个初始点之外的每个点就近分配给最近（离簇的质心最近）的簇。需要注意的是当新的点分配到一个簇之后，质心可能会漂移。但是由于只有簇附近的点才可能会被分配给自己，所以
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。