论文：Bradley P S, Bennett K P, Demiriz A. Constrained K-Means Clustering[J]. 2000, 59(1):1–34.笔记

最新推荐文章于 2021-08-19 19:26:32 发布

分布式数据管理

最新推荐文章于 2021-08-19 19:26:32 发布

阅读量1.2k

点赞数 2

分类专栏：机器学习文章标签：平衡聚类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/BOBOyspa/article/details/77989836

版权

机器学习专栏收录该内容

9 篇文章 2 订阅

订阅专栏

最近在研究平衡聚类方面的问题，做了些调研，最早研究这方面是2000年

实验效果

在两组实际数据集上测试（简写为I与W），其中I数据集包括351个包括33维的数据点，同时每一个维度的值进行标准化处理；W数据集包括683个包括9维的数据点

这里写图片描述

上图表示，分别对数据集I和W使用K-Means进行聚类，对于使用不同K的聚类结果而言（10,20,50），随着τ的上升，聚类结果中簇的数据点总数小于τ的簇数目趋势；

这里写图片描述

上图表示，对于Contrained Clustering与Standard K-Means，对于使用不同K的聚类结果而言（10,20,50），两种方法的损失函数比值随着τ的上升变化趋势（τ为簇中数据点个数）；

算法优缺点：

优点：相比于Standard K-Means算法，Contrained Clustering能够寻找到更好的最优点，需要结合k和τ共同来共同确定最优点，例如当k为20，τ为10时，Contrained/Standard的比率大于1；

缺点：对于τ较大时，Contrained Clustering的效果次于传统的Standard K-Means，在τ较小时，除能够发现更好的最优点之外，效果与传统的Standard K-Means相近；

分布式数据管理

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。