GN算法思想
在一个网络之中,通过社区内部边的最短路径相对较少,而通过社区之间边的最短路径的数目则相对较多。Newman等人结合这一网络结构在2002年提出了GN算法,GN算法是一个基于删除边的算法,该算法的本质是基于聚类中的分裂思想。GN算法在原理上是使用边介数作为相似度的度量方法,该算法每次都会选择边介数高的边删除,进而网络分裂速度远快于随机删除边时的网络分裂。
边介数
边介数(betweenness)是指从某个源节点S出发通过该边的最短路径的数目,对所有可能的源节点,重复做同样的计算,并将得到的相对于各个不同的源节点的边介数相加,所得的累加和为该边相对于所有源节点的边介数。
算法步骤
(1)计算每一条边的边介数;
(2)删除边介数最大的边;
(3)重新计算网络中剩下的边的边介数;
(4)重复(3)和(4)步骤,直到网络中的任一顶点作为一个社区为止。
算法缺陷