参考论文Revealing the role of node similarity and community merging in community detection
重叠社区检测算法:
基于种子扩展的算法:分为两步:种子检测和社区扩展,
种子检测是基于节点中心性指数来寻找社区的核心成员。
越来越多的研究表明社区形成依靠核心成员。最简单的种子检测方法随机的挑选节点作为种子,但是容易获得低质量的社区。接下来提出使用k-社区作为初始社区,然而,该方法不能通过忽略其大小小于k的完整子图形来覆盖整个网络。Wang使用Graclus的算法获得类的个数并且取类的中心作为种子。Bai提出了基于节点距离矩阵选择社区核心成员的三步过程
种子的质量主要依靠节点中心性指数。(1)种子应该有很多邻居,所以挑选局部最大度节点作为种子是合理的。
Zhang et al. [40] and Yu et al. [32] 引进了中心指数(思考了每个节点第一级和第二级邻居)(2)种子应该有紧密相连的邻居,Rhouma等人[30]提出了一个中心性指标,该指标根据每个节点类的局部系数来建模一个节点及其邻居能够形成一个团的数量。
社区扩展基于优化质量函数根据种子来建立社区,质量函数主要分为四类:(1)基于内部连接(2)基于外部连接(3)基于内部和外部连接(4)基于一个网络模型。
Yang and Leskovec研究了13种质量函数。Kloumann研究了几种社区扩展的方法。发现基于影响传播的方法具有较高的查全率。
社区融合的目的就是删除重复的社区并且获得有意义的社区。Shen提出将有最大相似度的两个社区合并。Palla提