复杂网络分团算法分类及评价指标_gn算法自上而下-CSDN博客

本文链接：https://blog.csdn.net/Carl_changxin/article/details/114278332

理论指标：复杂网络分团的评价指标

复杂网络划分方法的研究综述（Research Review on Algorithms of Community Detection in Complex Networks-Jingyi Zhang et al.）

2002年，提出了社区结构的概念纽曼（Newman）认为，社区中节点之间的联系比不同社区中节点之间的连接更紧密。
社区检测算法分为重叠社区检测算法和非重叠社区检测算法。
重叠社区检测算法具有较好的实际意义比非重叠社区检测算法。首先，重叠节点是关键节点在网络中，因此社区彼此连接。其次，社区重叠可以更好地反映现实世界中的真实网络结构。
如今，已经有大量的社区检测算法。根据算法的出发点不同，这些算法可以大致分为四类：基于模块度（modularity）的算法，基于集团渗透（clique percolation）的算法，基于标签传播（label propagation）以及基于分层划分（hierarchical partitioning）的算法。

基于模块度的方法：Louvain-Blondel et al. ；SLM-Waltman et al.
基于集团渗透的方法：不稳定，不利于规模大的网络结构
基于标签传播的方法：通常，在复杂的网络中，节点之间的边缘代表个体之间信息的传播。根据社区特征，可以知道社区中的节点共享相同的信息，而不同社区中的节点共享不同的信息。因此，产生了基于标签传播的社区检测算法。标签传播算法的最大优点是该算法不需要任何参数，并且具有线性时间复杂度，因此执行效率非常高。但是该算法只能检测不重叠的社区结构。LPA-Zhu et al.
基于分层划分的方法：基于分层划分的社区检测算法包括两种类型：分裂分层方法和浓缩分层方法。前者将整个网络从顶部拆分自下而上，直到将单个节点视为社区；后者则相反，将单个节点视为通过单个链接压缩社区，并从下到上合并为一个社区。GN-Girvan and Newman(该算法首先计算网络中所有边缘的边缘中间度。去除边缘之间具有最高边缘的边缘。然后计算网络中其余边缘的边缘中间度，并重复此过程，直到网络中没有边缘为止。最终获得了自上而下的层次树。可以将树划分为具有最大模块化的层次结构层。由于GN算法需要重复计算每个边缘的边缘中间度，因此复杂网络中的时间复杂度非常高，但是算法的精度更高。)

评估社区检测算法性能的指标：准确性，标准化互信息，模块性，雅卡系数，聚类系数等。其中三个经典的评估指标：准确度，标准化的互信息和模块度