课程3基于Barabási的《network science》第3、4章。
第3章的标题为随机网络(random networks)。我们首先有一个随机变量服从某一分布的概念,比如r.v.服从bionomial distribution(N个事件中成功的次数为k的概率)。在network里,r.v.是一个node的degree为k的概率,(p是指两个node之间有link的概率),那么需要假设node总数为N。显然network的结点总数在一开始固定(fixed)了,这一类模型就是静态模型(static models)。
书中讨论的随机网络有两种,一种就是度分布服从二项分布;而现实生活中,大部分的网络都是稀疏的(sparse),所以可以想成node总数N很大,而link的概率p很小,则可以由Poisson distribution来近似,所以第二种是泊松分布。
我们为什么要将二项分布近似为泊松分布?-因为在泊松分布下:平均度c,度平方的平均<k^2>,度的标准差σ_k这些网络的关键特性的形式更简单,都只依赖< k>这个参数。
当N=100时,可以看作小网络,这时候度分布服从二项分布;当N=1000,10000时,可以看作大网络,这时候度分布服从泊松分布。
随机网络又称Erdös-Rényi model。还有一种随机网络是Watts-Strogatz model,是对前者的扩展。
然而事实上,真实网络的很多性质并不能被random network很好地解释,random network唯一能解释的性质只有small world,即平均路径长度很短,只有2-3(类似于六人定律)。即在随机网络里,平均路径长度也很短,和现实生活里的网络的平均路径长度一样很短~
第4章的标题为无标度性质(The scale-free property)。已知现实里大部分网络并非泊松分布,甚至并非随机网络!因为在泊松分布里,不可能有大量的度非常大的节点(Hub)出现,而现实里却有。且节点的度之间有很大差异,而泊松分布里节点的度相差只有2个< k>的平方根的范围(< k>±σ_k,σ_k=< k>^(1/2))。
而当度分布服从幂律(power law)时,
就可以很好地勾画Hubs的存在了。
在2<γ<3时,才是无标度网络,此时度分布的二阶矩是发散的,而一阶矩不是发散的。这也解释了为什么叫无标度,因为度可以很大,也可以很小。
当γ=3时,称为critical point临界点。当γ>3时,是随机网络可以解释的small world情况。所以在2<γ<3时,无标度网络会是怎么样?-它是ultra-small world property,因为它使节点间的平均距离比随机网络的平均距离更小。
现实生活中,没有γ<2的情况,度分布一阶矩< k>发散,因为此时Hub的link数比网络的大小增长更快,hub的度一定会超过节点总数,这是不可能的。(4.7和4.8再理解一下)