cs224w笔记:slide2(上)

网络的属性

用哪些指标去描述一个网络呢?

  1. 度分布(Degree distribution): P ( k ) P(k) P(k)
  2. 路径长度(Path length): h h h
  3. 聚类系数(Clustering coefficient): C C C
  4. 连通性(Connected components): s s s

我们将用无向图来分析这些属性,至于有向图,多数情况下可以从无向图自然而然地拓展到有向图。

1. 度分布 P ( k ) P(k) P(k)

度分布 P ( k ) P(k) P(k),指从一个网络的所有节点 N N N中,选择出一个度为 k k k的节点的概率。
P ( k ) = N k N P(k)=\frac{N_k}{N} P(k)=NNk
N k N_k Nk,表示在这个网络中,度为 k k k的节点的个数
在这里插入图片描述

2. 路径(Path)

图中的一条路径,是指从一个节点到达另一个节点的边的序列,路径长度就是经过的边的条数。
在这里插入图片描述

  • 路 径 长 度 h i j 路径长度 h_{ij} hij: 从节点 i 到节点 j 经过的边数。
  • E m a x = n ( n − 1 ) / 2 E_{max}=n(n-1)/2 Emax=n(n1)/2
  • 平均路径长度 h ˉ \bar h hˉ: h ˉ = 1 2 E m a x ∑ i , j ≠ i h i j \bar h=\frac{1}{2E_{max}}\sum_{i,j\neq i}h_{ij} hˉ=2Emax1i,j=ihij
3. 聚类系数(Clustering coefficient)

节点 i 的邻居之间,联系密切不密切呢?怎样观察呢?用聚类系数。

  • 节点 i
  • 节点 i 的度为 k i k_i ki,这意味着节点 i 的邻居一共有 k i k_i ki 个;
  • e i e_i ei,表示这这 k i k_i ki个邻居之间有多少条边相连;
  • k i ( k i − 1 ) k_i(k_i-1) ki(ki1) ,这 k i k_i ki个邻居之间最多可以有多少条边;
  • 节点 i 的聚类系数 C i C_i Ci
    C i = 2 e i k i ( k i − 1 ) , C i ∈ [ 0 , 1 ] C_i=\frac{2e_i}{k_i(k_i-1)},C_i\in[0,1] Ci=ki(ki1)2eiCi[0,1]
    在这里插入图片描述
  • 平均聚类系数 C i C_i Ci
    C = 1 N ∑ i N C i C=\frac{1}{N}\sum_i^NC_i C=N1iNCi
    在这里插入图片描述
4. 连通性(Connectivity)

最大连通分量(largest connected component):从图中的一个节点出发,能够到达的最多的节点的数量。
在这里插入图片描述
怎样寻找图中的最大连通分量呢?
这就用到图的遍历算法了,广度优先遍历算法 Breadth First Search (BFS),深度优先遍历算法Depth First Search(DFS)。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值