networkx计算边的重要性:边介数或者中介中心性edge_betweenness

背景

最近需要在一个节点数300+万,边400+万的有向图中删除某一些边的子集,但是又需要尽量减少对图的弱连通性的影响。最后的解决方案中一部分是,先将有向图转为无向图,计算边的betweenness,有时也被翻译成中介中心性,然后删除中介中心性较低的边。

定义

betweenness顾名思义,是它作为中介的一种度量。具体是在所有最短路径中,此边通过的最短路径所占的比例。因此betweenness越高,其中介性越高。
c B ( e ) = ∑ s , t ∈ e σ ( s , t ∣ v ) σ ( s , t ) c_B(e) =\sum_{s,t \in e } \frac{\sigma(s, t|v)}{\sigma(s, t)} cB(e)=s,teσ(s,t)σ(s,tv)
我认为删除中介性更高的边,对图的连通性影响性更大。

实例

建图

import networkx as nx
G = nx.Graph()
G.add_edges_from([[0, 1], [0, 2], [1, 2], [2,3], [3,4], [4,5], [3,5]])
nx.draw(G, with_labels=True)

在这里插入图片描述
计算

nx.edge_betweenness_centrality(G, k=None)
>>> {(0, 1): 0.06666666666666667,
 (0, 2): 0.26666666666666666,
 (1, 2): 0.26666666666666666,
 (2, 3): 0.6,
 (3, 4): 0.26666666666666666,
 (3, 5): 0.26666666666666666,
 (4, 5): 0.06666666666666667}

可以看到(2, 3)的中介性最高,(0, 1) (4, 5)的中介性最低,其余几条边的中介性相同,跟预期相同。

大规模图上的边介数

既然edge_betweenness的计算涉及了最短路径,因此计算复杂度一定不低,因此在大规模图上有实现难度。不过networkxedge_betweenness提供了一个k参数,选择sample的节点数目。k越大,其计算的介数准确度越高。
在我的大规模图上,我选择了10,计算时长在一个小时左右。根据返回的edge_betweenness删除边后,图的连通性的影响在可接受范围内。
另外需要注意的是,当设置了k后,返回的edge_betweenness不一定包括所有的边。这里面的具体原理还需要看代码。不过我个人理解,缺失的边的中介性是很低的。

  • 5
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值