kmeans python变量重要性_k-means聚类算法优缺点？

最新推荐文章于 2024-06-08 07:00:00 发布

weixin_39845461

最新推荐文章于 2024-06-08 07:00:00 发布

阅读量1k

点赞数

文章标签： kmeans python变量重要性

K-Means是我们最常用的基于欧氏距离的聚类算法，它的基本思想是，两个目标的距离越近，相似度越大。

K-Means算法的目标函数

K-Means算法要实现的目标函数是：

其中，C1，C2，...，Ck是分别是k个cluster的中心点；C(Xi)表示Xi这个点所属于的cluster的中心点；d²( , )表示求两个点的距离的平方。

用通俗的话说，K-Means算法要实现的目的是：使得样本空间所有的非中心点，到它们各自所属的cluster的中心点的距离的平方，的和最小。

上述问题是一个NP-Hard问题。因此，一般是采用坐标下降(Coordinate Decendet)的方法求解。坐标下降法属于非梯度优化的方法，它在每一步迭代中沿着一个坐标轴的方向进行探索，通过循环使用不同的坐标来达到求解目标函数的局部最小值。坐标下降算法。来源：https://zh.wikipedia.org/zh-cn/%E5%9D%90%E6%A0%87%E4%B8%8B%E9%99%8D%E6%B3%95

如上图所示，假设总共有两个维度x，y：我们首先选择一个初始位置(x,y)，然后假设x未知并将y的值代入目标函数中，令目标函数的导数为0，可以求得此时最佳的x的值。

然后又假设y未知并将刚刚求得的x的值代入目标函数，令目标函数的导数为0，可以求得此时最佳的y。

重复执行第1步和第2步，目标函数会逐渐接近极小值点，直到达到了极小值点后停止。

最低0.47元/天解锁文章

weixin_39845461

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
kmeans python变量重要性_k-means聚类算法优缺点？

K-Means是我们最常用的基于欧氏距离的聚类算法，它的基本思想是，两个目标的距离越近，相似度越大。K-Means算法的目标函数K-Means算法要实现的目标函数是：其中，C1，C2，...，Ck是分别是k个cluster的中心点；C(Xi)表示Xi这个点所属于的cluster的中心点；d²( , )表示求两个点的距离的平方。用通俗的话说，K-Means算法要实现的目的是：使得样本空间所有的非中心...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。