最近要写论文涉及到聚类集成,想先从EAC做起,集成方面做得还不是很好。如果有机会的话,希望也在研究集成聚类的大佬们和我联系,一起研究探讨集成聚类这方面的知识。感谢各位!
证据积累的想法是这样的:将每个聚类结果作为数据组织独立的证据,把多个聚类的结果合并到一个分区中。
方法为拆分合并:
(1)拆分:把大型的多维数据分成小型的球型簇。
使用K-Means算法执行此步骤,因为通过K的随机初始化,可以获得各种聚类结果。
(2)结合:为将不同数目的聚类分区并到一块,使用“投票法”合并聚类的结果。
那么肯定会有这么一种可能,“自然”产生的集群可能在不同集群下的统一集群(不同的划分,做出一个邻近度矩阵)
在同一个集群下模式对的同时出现做一个投票标记给关联上。做一个矩阵
N是聚类的数目,