肘方法确定聚类数k_一种新的原型聚类方法:K-multiple-means

db8cb4cb0383936b67f143a566354946.png

k-means很适合对簇状分布的数据聚类,同时可以得到每类数据的prototype,也就是均值点,用来做向量量化之类的任务。但k-means解决不了非簇状分布的数据聚类问题,所以也就没法给出非簇状数据的prototype。

谱聚类虽然可以很好的解决非簇状分布的数据聚类问题,但也没有办法给出每一类数据对应的prototype。

Multiple Prototype试图通过对每一类数据用多个prototype进行表示,解决非簇状分布数据的原型聚类问题。这个小问题的研究工作比较少。以前的工作往往采用自上而下的凝聚式策略进行聚类,运算时间很高。

K-Multiple-Means (KMM) 定义了一个显示的目标函数,在给定总的聚类数k和总的prototypes数m时,通过优化问题求解,自适应的把m个prototype以及n个原始数据点划分到k类中。K-Multiple-Means并不是不考虑n个原始数据点,仅仅对m个prototype进行聚类,而是迭代地划分prototype和原始数据形成的二部图,最终得到的二部图刚好划分为k类,聚类结果可以直接根据图的连通性得到。同时还会给出每个原始数据点和最近的j个prototype的连接概率(就是边的权重)。KMM 的计算复杂度是O(nm^2),相对于n是线性,但对m是二次的。我们在理论上分析了 KMM 和k-means的联系。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值