进化聚类算法——k-means

本文介绍如何将传统的k-means算法套进进化聚类框架中。

将待聚类对象归一化为欧几里德空间中的单位向量。即在时间t上的对象由给出,其中每一个,并且距离矩阵

我们首先介绍一下传统的k-means算法。令t为固定的时间步长,令。这个算法首先需要设置k个聚类质心。,其中;质心的初始化可以随机指定或者使用前一个聚类集中的结果(增量k-means)。令closest(t)为所有接近质心的点集。即:

该算法在几个遍历中进行,在每个遍历过程中,它根据当前分配给该质心的数据元素更新每个质心。

然后将标准化为单位长度。算法经过足够多的遍历后终止,聚类由k个质点的集合给出。

我们定义k-means的快照质量

(由于所有的点都在单位球面上,距离的上界为1)

我们定义历史成本函数,即两个聚类的距离:

f是一个将C的质心映射到C‘的函数。通过匹配C中的每一个质心到C’中的质心是计算两个聚类距离最可行的办法,然后把这些匹配的距离相加。

如前所述,我们使用贪婪近似算法来选择序列中的下一个集群。然而,在k-means的例子中,对于当前的质心来说,让为在中的最接近的质点。令为在时间t上聚类j的点的的数目;令对应的数目。令。然后,更新

换句话说,新的质心在非进化k-means建议的质心和从前一个时间步上的最接近匹配之间,通过cp和两个聚类的相对大小来加权。同样,它被标准化为单位长度,我们继续通常的k-means迭代。

 

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值