机器学习小组知识点35:二分K-means聚类

本文介绍了二分K-Means算法,作为改进的KMeans聚类方法,它避免了随机初始化导致的局部最优问题。算法首先将所有数据点视为一个簇,随后不断分裂误差最大的簇,直至达到预设的簇数K。二分KMeans通过多次试验和选择最小误差的划分,逐步得到全局最优解。最后,文中提供了算法的Matlab代码实现。
摘要由CSDN通过智能技术生成

常规的KMeans算法的误差通常只能收敛到局部最小,在此,引入一种称为二分K-Means(bisecting kmeans)的算法,相较于常规的KMeans,二分KMeans不急于一来就随机 K 个聚类中心,而是首先把所有点归为一个簇,然后将该簇一分为二。计算各个所得簇的代价函数(即均方误差),选择误差最大的簇再进行划分(即最大程度地减少误差),重复该过程直至达到期望的簇数目。

二分K-means算法的主要思想:

首先将所有点作为一个簇,然后将该簇一分为二。之后选择能最大程度降低聚类代价函数(也就是误差平方和)的簇划分为两个簇。以此进行下去,直到簇的数目等于用户给定的数目 K 为止

二分KMeans算法流程大致如下:

初始化簇表,使之包含由所有的点组成的簇。
repeat
{
{对选定的簇进行多次二分试验}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值