【图论】节点的几种中心性

参考资料:https://www.ultipa.cn/document/ultipa-graph-analytics-algorithms/degree/v4.0


本文主要内容是介绍图分析相关的概念与算法

中心性

节点度(Degree)

概述

节点度算法为每个节点计算与其相连的边的数量;当边上有权重时,则计算权重的总和。节点度是面向节点的浅层(≤ 1层)计算,是一种最简单、最高效的图算法,在科学计算、特征提取、超级节点识别等领域扮演着至关重要的角色。

基本概念

度的方向
节点的出边的数量称为节点的出度,节点的入边的数量称为节点的入度。如果忽略边的方向计算所有边的数量,就得到节点的度(或度中心性)。
在这里插入图片描述
上图中红色节点的出度为 3,入度为 4,度为7。需要注意的是,有向的自环边会被看作一条出边和一条入边。

边权重
边权重可以是边的某一个属性值。指定了边权重时,节点度就是边权重的和;不指定边权重时,节点度也可以理解为所有边的权重均为 1 时的节点度。
在这里插入图片描述
边加权后,上图中红色节点的出度为 1 + 0.2 + 2 = 3.2,入度为 0.5 + 0.3 + 2 + 1 = 3.8,度中心性为 3.2 + 3.8 = 7

特殊处理

孤点、不连通图
由于没有连接其他节点的边,孤点的节点度完全取决于其自环边。

自环边
自环边会被看作一条出边和一条入边。

有向边
有向边的方向是计算节点出度和入度的依据;计算度中心性时则会忽略边的方向。


接近中心性(Closeness Centrality)

接近中心性用来衡量节点在其连通分量中到其它各点的最短距离的平均值。该概念可以帮助选出连通分量内距离各点最近的点,因而被广泛用于关键社交节点发现、功能性场所选址等应用场景。
在这里插入图片描述
接近中心性的取值范围是 [0,1],数值越大越靠近中心。

接近中心性在实际应用中有着多种定义,其原始概念是由 Alex Bavelas 于 1950 年提出的,相关资料如下:

  • A. Bavelas, Communication patterns in task-oriented groups (1950)

调和中心性(Harmonic Centrality)

调和中心性算法是接近中心性算法的变种。接近中心性衡量的是节点在其连通分量中到其它各点的平均最短距离,显然在不连通图中就无法体现节点在全图的中心性;调和中心性提出的“平均最短距离”则是对这些最短距离的倒数求和,这使它可以处理非连通图中会出现的无限值。调和中心性算法首先是由 M. Marchiori 和 V. Latora 于 2000 年提出的,然后由 A. Dekker 和 Y. Rochat 分别于 2005 年和 2009 年提出。
在这里插入图片描述

调和中心性的取值范围是 [0,1],数值越大中心性越大。

算法的相关资料如下:

  • M. Marchiori, V. Latora, Harmony in the Small-World (2000) A. Dekker,
  • Conceptual Distance in Social Network Analysis (2005) Y. Rochat,
  • Closeness Centrality Extended to Unconnected Graphs: The Harmonic Centrality Index (2009)

图中心性(Graph Centrality)

图中心性用来衡量节点在其连通分量中到其它各点的最短距离的最大值。该概念与其它概念(如接近中心性、图直径等)一起可以综合判定一个点是否从真正意义上位于图的最中心。
在这里插入图片描述
图中心性的取值范围是 [0,1],数值越大越靠近中心。
在接近中心性相同时,图中心性可作为判断哪个节点更靠近中心的辅助依据。


中介中心性

中介中心性(Betweenness Centrality)用来衡量点处于其它任意两点间最短路径之中的概率。该概念由 Linton C. Freeman 于 1977 年提出,能有效地计算出在图的多个部分间起重要桥梁、媒介作用的点。
在这里插入图片描述
中介中心性的取值范围是 [0,1],数值越大中介作用越强。

相关资料如下:

  • L.C. Freeman, A Set of Measures of Centrality Based on Betweenness(1977)
  • L.C. Freeman, Centrality in Social Networks Conceptual Clarification (1978)

特征向量中心性(Eigenvector Centrality)

特征向量中心性算法度量的是节点影响的传递。来自高分值节点的关系对节点分值贡献大于来自低分值节点的关系,节点有高分值意味着它连接到许多高分值节点。特征向量中心性强调节点所处的周围环境,例如在疾病传播中,特征向量中心性较大的节点距离传染源更近的可能性更大,需要格外防范。

Google 著名的 PageRank 算法是特征向量中心性算法的一个变种,用来进行网页排名。

特征向量中心性的取值范围是 [0,1],数值越大中心性越大。


CELF

CELF(Cost Effective Lazy Forward,具有成本效益的惰性前向选择)算法可以在一个有传播行为的网络中选取一些种子节点作为传播源头,以达到影响力最大化(Influence Maximumization, IM)的效果。CELF 算法由 Jure Leskovec 等人于 2007 年提出,它改进了传统基于 IC 模型的贪心算法,利用函数次模性,只在初始时计算所有节点的影响力,之后不再重复计算所有节点的影响力,因此具有更高的成本效益。CELF 算法的一个典型应用场景是预防流行病爆发,通过选择出一小组人进行监测,从而达到任何疾病在爆发的早期就能被发现的效果。

算法的相关资料如下:

  • J Leskovec, A. Krause, C. Guestrin, C. Faloutsos, J. VanBriesen, N. Glance, Cost-effective Outbreak Detection in Networks (2007)
  • D. Kempe, J. Kleinberg, E. Tardos, Maximizing the Spread of Influence through a Social Network (2003)

相似性(施工中)

杰卡德相似性

重叠相似度

余弦相似度

皮尔森相关系数

欧几里得距离

  • 1
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值