机器学习小组知识点35：二分K-means聚类

最新推荐文章于 2024-07-05 23:11:55 发布

Eric2016_Lv

最新推荐文章于 2024-07-05 23:11:55 发布

阅读量1k

点赞数

分类专栏： Matlab 机器学习数据挖掘算法文章标签：机器学习算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Eric2016_Lv/article/details/61200901

版权

本文介绍了二分K-Means算法，作为改进的KMeans聚类方法，它避免了随机初始化导致的局部最优问题。算法首先将所有数据点视为一个簇，随后不断分裂误差最大的簇，直至达到预设的簇数K。二分KMeans通过多次试验和选择最小误差的划分，逐步得到全局最优解。最后，文中提供了算法的Matlab代码实现。

摘要由CSDN通过智能技术生成

常规的KMeans算法的误差通常只能收敛到局部最小，在此，引入一种称为二分K-Means（bisecting kmeans）的算法，相较于常规的KMeans，二分KMeans不急于一来就随机 $K$ 个聚类中心，而是首先把所有点归为一个簇，然后将该簇一分为二。计算各个所得簇的代价函数（即均方误差），选择误差最大的簇再进行划分（即最大程度地减少误差），重复该过程直至达到期望的簇数目。

二分K-means算法的主要思想：

首先将所有点作为一个簇，然后将该簇一分为二。之后选择能最大程度降低聚类代价函数（也就是误差平方和）的簇划分为两个簇。以此进行下去，直到簇的数目等于用户给定的数目 $K$ 为止

二分KMeans算法流程大致如下：

初始化簇表，使之包含由所有的点组成的簇。
repeat
{
{对选定的簇进行多次二分试验}

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。