网络的属性
用哪些指标去描述一个网络呢?
- 度分布(Degree distribution): P ( k ) P(k) P(k)
- 路径长度(Path length): h h h
- 聚类系数(Clustering coefficient): C C C
- 连通性(Connected components): s s s
我们将用无向图来分析这些属性,至于有向图,多数情况下可以从无向图自然而然地拓展到有向图。
1. 度分布 P ( k ) P(k) P(k)
度分布
P
(
k
)
P(k)
P(k),指从一个网络的所有节点
N
N
N中,选择出一个度为
k
k
k的节点的概率。
P
(
k
)
=
N
k
N
P(k)=\frac{N_k}{N}
P(k)=NNk
N
k
N_k
Nk,表示在这个网络中,度为
k
k
k的节点的个数。
2. 路径(Path)
图中的一条路径,是指从一个节点到达另一个节点的边的序列,路径长度就是经过的边的条数。
- 路 径 长 度 h i j 路径长度 h_{ij} 路径长度hij: 从节点 i 到节点 j 经过的边数。
- E m a x = n ( n − 1 ) / 2 E_{max}=n(n-1)/2 Emax=n(n−1)/2
- 平均路径长度 h ˉ \bar h hˉ: h ˉ = 1 2 E m a x ∑ i , j ≠ i h i j \bar h=\frac{1}{2E_{max}}\sum_{i,j\neq i}h_{ij} hˉ=2Emax1i,j=i∑hij
3. 聚类系数(Clustering coefficient)
节点 i 的邻居之间,联系密切不密切呢?怎样观察呢?用聚类系数。
- 节点 i
- 节点 i 的度为 k i k_i ki,这意味着节点 i 的邻居一共有 k i k_i ki 个;
- e i e_i ei,表示这这 k i k_i ki个邻居之间有多少条边相连;
- k i ( k i − 1 ) k_i(k_i-1) ki(ki−1) ,这 k i k_i ki个邻居之间最多可以有多少条边;
- 节点 i 的聚类系数
C
i
C_i
Ci:
C i = 2 e i k i ( k i − 1 ) , C i ∈ [ 0 , 1 ] C_i=\frac{2e_i}{k_i(k_i-1)},C_i\in[0,1] Ci=ki(ki−1)2ei,Ci∈[0,1]
- 平均聚类系数
C
i
C_i
Ci:
C = 1 N ∑ i N C i C=\frac{1}{N}\sum_i^NC_i C=N1i∑NCi
4. 连通性(Connectivity)
最大连通分量(largest connected component):从图中的一个节点出发,能够到达的最多的节点的数量。
怎样寻找图中的最大连通分量呢?
这就用到图的遍历算法了,广度优先遍历算法 Breadth First Search (BFS),深度优先遍历算法Depth First Search(DFS)。