啦啦啦~过来填坑啦,今天终于出太阳了,开森~
将从以下五个方面进行展开(参考书籍《基于复杂网络的机器学习方法》):
1.度和度相关性
2.距离和路径
3.网络结构
4.网络中心性
5.复杂网络度量方法的分类
1.度和度相关性
密度:衡量网络中各个节点间的连接强度。将密度接近0的网络称为稀疏网络。
网络同配性:网络同配性主要是根据网络中节点的度,从网络结构的角度考虑网络中节点相连的可能性。同配系数r是一种基于度的皮尔逊相关系数。
r是正值时,表示度大的节点倾向于连接度大的节点; r是负值时,表示度大的节点倾向于连接度小的节点。
r=+1时,表示网络具有很好的同配性; r=+1时,表示网络具有很好的异配性。
社交网络就表现出很明显的同配性;而科技网络,生物网络以及金融网络则表现出很强的异配性。
局部同配性:每个节点在整个网络同配性中所占的比例。
非归一化富人俱乐部系数:只关注节点与超过一定度数的节点相连的可能性。
归一化富人俱乐部系数:消除了相同度分布下由结构所引起的差异,更能体现富人俱乐部效应的重要性。
2.距离和路径
直径:节点间的最大路径长度称为网络的直径。
节点偏心率:表示网络中其他节点与其距离最长的路径。
半径:偏心率最小的节点间的距离。
维纳指数:所有节点间距离的和。
网络全局效率:网络中信息传播效率记为GE,它与网络中节点间的距离成反比。
网络平均一致估计:网络全局效率的倒数称为网络的平均一致估计。
3.网络结构
局部聚类系数:量化了局部积聚的能力。
网络聚类系数:用于度量网络的积聚情况。如果CC=1,说明网络中所有点都是相连的,如果CC趋近于0,说明网络的连接较为松散。
循环系数:描述了复杂网络中的流通度。
网络全局循环系数:网络中所有节点的循环系数的平均值称为网络的全局循环系数。
模块化系数:用来度量网络中某一特定聚类的可能性,即度量网络中聚类的强度。其取值区间为【0,1】.当模块性接近0时,表明网络中不存在社团结构,即网络中的节点是随 意相连的;随着模块化系数的增加,社团结构越来越清晰。模块化系数定义了每个节点属于某一社团的可能性,在网络形成时根据模块化系数确定节点是否属于某一社团。
模块化系数反映了模块中节点的集中程度,而不是所有模块之间的随机分布。
拓扑重叠指数:度量网络中大致处于相同社团的两个点的连接程度。
4.网络中心性
具有较大度数的节点是网络的中心,而较小度数的节点通常是外围或者末端的节点。度数较大的节点通常被称为关键节点。
基于距离的网络中心性:
极小极大准则:像医院等急救场所的选址问题,确定一个使最大反应时间最小化的位置。
极小求和准则:例如购物中心等服务设施的选址,目标是尽量使总的路程时间最小。
在社交网络分析中,基于这一概念的网络中心性指标称为亲密度。
基于路径的网络中心性:主要考虑通过节点的路径数量。
介数中心性:主要度量网络中每对节点位于最短路径上的程度。由于信息以相同的概率通过每一个节点,每条信息传播中通过的节点数量只与节点所处的最短路径的节点数量成比例。这一路径上节点的数量为网络的介数中心度数。
连通度:从节点p到节点q通过最短路径和不同长度的随机游走而进行信息传递的能力称为连通度。
基于特征向量的网络中心性:在定义中,当某一节点具有较大的特征向量中心性指数时,它的邻域节点更重要,为关键节点。
Bonacich特征向量中心性算法:利用邻接矩阵特征向量计算网络中心性。
Katz指数:该指数用来确定个体在网络中的重要性或状态。
PagRank算法:谷歌用于网页排名的著名算法。可以模拟用户浏览网页的行为。
特征向量中心性算法:节点的重要性取决于它的邻域节点的重要性。
5.复杂网络度量方法的分类
严格局部计算:度,强度等
混合计算:如局部聚类系数,拓扑重叠指数等
全局计算:如网络全局效率,半径等