论文:Bradley P S, Bennett K P, Demiriz A. Constrained K-Means Clustering[J]. 2000, 59(1):1–34.笔记
最近在研究平衡聚类方面的问题,做了些调研,最早研究这方面是2000年实验效果在两组实际数据集上测试(简写为I与W),其中I数据集包括351个包括33维的数据点,同时每一个维度的值进行标准化处理;W数据集包括683个包括9维的数据点上图表示,分别对数据集I和W使用K-Means进行聚类,对于使用不同K的聚类结果而言(10,20,50),随着τ的上升,聚类结果中簇的数据点总数小于τ的簇数目趋势;上图表示
复制链接