理论指标:复杂网络分团的评价指标
复杂网络划分方法的研究综述(Research Review on Algorithms of Community Detection in Complex Networks-Jingyi Zhang et al.)
- 2002年,提出了社区结构的概念纽曼(Newman)认为,社区中节点之间的联系比不同社区中节点之间的连接更紧密。
- 社区检测算法分为重叠社区检测算法和非重叠社区检测算法。
- 重叠社区检测算法具有较好的实际意义比非重叠社区检测算法。 首先,重叠节点是关键节点在网络中,因此社区彼此连接。 其次,社区重叠可以更好地反映现实世界中的真实网络结构。
- 如今,已经有大量的社区检测算法。 根据算法的出发点不同,这些算法可以大致分为四类:基于模块度(modularity)的算法,基于集团渗透(clique percolation)的算法,基于标签传播(label propagation)以及基于分层划分(hierarchical partitioning)的算法。
- 基于模块度的方法:Louvain-Blondel et al. ;SLM-Waltman et al.
- 基于集团渗透的方法:不稳定,不利于规模大的网络结构
- 基于标签传播的方法:通常,在复杂的网络中,节点之间的边缘代表个体之间信息的传播。 根据社区特征,可以知道社区中的节点共享相同的信息,而不同社区中的节点共享不同的信息。 因此,产生了基于标签传播的社区检测算法。标签传播算法的最大优点是该算法不需要任何参数,并且具有线性时间复杂度,因此执行效率非常高。 但是该算法只能检测不重叠的社区结构。LPA-Zhu et al.
- 基于分层划分的方法:基于分层划分的社区检测算法包括两种类型:分裂分层方法和浓缩分层方法。 前者将整个网络从顶部拆分自下而上,直到将单个节点视为社区; 后者则相反,将单个节点视为通过单个链接压缩社区,并从下到上合并为一个社区。GN-Girvan and Newman(该算法首先计算网络中所有边缘的边缘中间度。 去除边缘之间具有最高边缘的边缘。 然后计算网络中其余边缘的边缘中间度,并重复此过程,直到网络中没有边缘为止。 最终获得了自上而下的层次树。 可以将树划分为具有最大模块化的层次结构层。 由于GN算法需要重复计算每个边缘的边缘中间度,因此复杂网络中的时间复杂度非常高,但是算法的精度更高。)
- 评估社区检测算法性能的指标:准确性,标准化互信息,模块性,雅卡系数,聚类系数等。其中三个经典的评估指标:准确度,标准化的互信息和模块度