一、度分布的概念
把网络中节点的度按从小到大排序,从而统计得到度为k的节点占整个网络节点数的比例怕p
k
_k
k。例如下图:
从概率统计的角度看,p
k
_k
k也可以视为网络中一个随机选择的节点的度为k的概率,这就是度分布的概念。
无向网络的度分布P(k)定义为网络中一个随机选择的节点的度为k的概率。有向网络的出度分布P(k
o
u
t
^{out}
out)定义为网络中随机选取的一个节点的出度为k
o
u
t
^{out}
out的概率;入度分布P(k
i
n
^{in}
in)定义为网络中随机选取的一个节点的入度为k
i
n
^{in}
in的概率。
二、从钟形曲线到长尾分布
1、钟形曲线
类似于正态分布的曲线称为钟形曲线,正态分布是针对连续型随机变量而言的。常见的离散型概率分布如超几何分布,二项分布和泊松分布,,它们的概率分布图都近似具有钟形形状。
服从钟形分布的随机变量具有一个明显的特征标度即钟形曲线的峰值。例如人的身高分布具有钟形曲线的形状。
2、长尾分布
若考查全球个人财富,则不具有钟形曲线的形状,因为财富很不均匀。既有穷人,也有富可敌国的富人。此分布图与钟形分布不同,它有一个长长的尾巴,称为长尾分布。
与钟形分布存在一个明显的特征标度不同,长尾分布往往不存在单一的特征标度,因此也称为无标度分布。
所谓特征标度是指大部分取值应该落在以特征标度为中心的一个相对比较小的区间内。
3、实际网络的度分布曲线
如果一个实际网络的度分布曲线近似具有钟形形状,其形状在远离峰值处呈指数下降。这意味着我们几乎可以肯定地认为网络中所有节点的度都与网络的平均度相差不大。换句话说,网络中不存在一个具有比平均度大得太多的度值的节点。因此,这类网络也称为均匀网络或匀质网络。然而,大量实证研究表明,许多实际网络的度分布曲线都具有长尾的形状。