维纳指数起初用在化学领域,是一种用来描述分子结构的指数 [1],由 Harry Wiener 于1947年提出 [2]。除了化学领域,维纳指数也广泛应用于社会关系计量学和社交网络等领域 [1]。
定义
维纳指数原始的定义 [3] 为 图中所有的可到达的两个点之间的最短距离之和,在本文中,我们使用所有点对之间的 平均 最短距离 [4]:
WI
=
1
n
(
n
−
1
)
∑
i
=
1
n
∑
j
=
1
n
d
i
j
\text{WI} = \frac {1}{n(n - 1)} \sum_{i=1}^n \sum_{j=1}^n d_{ij}
WI=n(n−1)1i=1∑nj=1∑ndij
其中
d
i
j
d_{ij}
dij 代表两个点
i
i
i 和
j
j
j 之间的最短距离。
传统衡量方法的局限
在定义图的结构的扩散性时,传统方法各有其局限性 [4]。
-
图之大小(Size)
- 大图不一定扩散程度高,小图扩散程度亦不一定低,图之大小难以衡量图的结构的扩散性。 图之深度(Depth)
-
深度看起来是个很好的衡量方法,但是在某些特定情况下会表现的很差。
假如图是由一个很长的,每一层只有单个节点的链组成的,就像这样:
∘ → ∘ → ∘ → ⋯ → ∘ → ∘ → ∘ \circ \rarr \circ \rarr \circ \rarr \dots \rarr \circ \rarr \circ \rarr \circ ∘→∘→∘→⋯→∘→∘→∘
虽然其深度很大,但我们并不会认为它的扩散程度很高。
点之平均深度(Average Depth)
-
如果用点的平均深度(点到根节点的平均距离),不就解决了上面这个问题的吗?但是点的平均深度也有表现很差的时候。
例如,从根节点出发,经过一条很长的单链,然后开始扩散,如下图所示:
在这种情况下,尽管图的扩散程度并不高,但其点的平均深度很大。
示例
以 APS 论文引文数据集为例,下图拥有211个节点,维纳指数为2.87:
大部分的节点都直接相连于根节点,扩散程度并不高。而下图拥有277个节点,维纳指数为18.51:
与维纳指数为2.87的图相比,该图的扩散程度就非常高了。
代码
import matplotlib.pyplot as plt
import networkx as nx
import pygraphviz
from networkx.drawing.nx_agraph import graphviz_layout
# create graph
g = nx.Graph()
"""
Add edges to this graph.
# g.add_edges_from(...)
"""
# calculate wiener index
wi = nx.wiener_index(g) / (g.size()+1) / g.size() * 2
# plot
pos = graphviz_layout(min_g, prog='dot')
nx.draw(min_g, pos, with_labels=False, arrows=False)
plt.show()
Reference
- Wiener Index. (November 15, 2018). Retrieved from https://en.wikipedia.org/wiki/Wiener_index
- H. Wiener. (1947). Structural determination of paraffin boiling points. Journal of the American Chemical Society, 69(1), 17-20.
- networkx.algorithms.wiener.wiener_index. (September 19, 2018). Retrieved from https://networkx.github.io/documentation/stable/reference/algorithms/generated/networkx.algorithms.wiener.wiener_index.html#networkx.algorithms.wiener.wiener_index
- S. Goel, A. Anderson, J. Hofman, D. J. Watts. (2015). The Structural Virality of Online Diffusion. Management Science, 62(1), 180-196.