复杂网络简单理解

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/An_Wu/article/details/78651712

通俗易懂的复杂网络

1 什么是复杂网络

1.1 直观理解

什么是复杂网络?对普通人而言,在媒体上看到复杂网络,首先想到的是互联网,实际上网络已经成为Internet的代名词,确实Internet从只有几个结点的简单的网络,发展到今天Internet的用户已经数以亿计,即使不考虑终端用户,路由器的用户也是几万人,确实是复杂的网络,而且对互联网我们缺少统一的行政管理机构,可以说到今天已经没有任何一个人能够知道互联网上所有的路由器到底是怎么联结在一起,就是没有互联网联结一张很完整的清晰的地图。

世界上除了互联网以外,复杂网络的例子在我们生活中比比皆是,比如说我们把一个万维网做为一个结点,可以说至少和我们人类的数目相当的,所以万维网也是极其复杂的网络。就拿我们人体而言,我们人体当中实际上有各种各样的复杂网络,我们大脑当中的神经网络,实际上就是有数量高于十次方以上大量的神经源互相连接在一起,我们人体还有各种各样的新陈代谢网络。那么一条江河里面食物链构成的食物链也是网络,甚至大型软件系统都可以看成是小的对象类通过互相调用构成的复杂网络,因此可以说绝大部分的事物都可以看成是复杂网络。

1.2 复杂性的表征

复杂网络的复杂性到底体现在哪些方面?

1)直观而言,就是网络的结构非常复杂,比如说互联网、路由器和路由器怎么连接,我们没有很清晰、很规则的概念;

2)网络是不断演化的,以互联网而言,网络上我们可以说路由器是不断地增加,路由器与路由器之间的连接也是不断增长的;

3)连接的多样性。就像人类朋友的关系,朋友也有亲密和疏远之分;还有网络动力学的复杂性,互联网每一个路由器的动力行为,实际上都是在不停地变化,而且不同的结点都有不同的动力行为,这些都是网络复杂的因素。

1.3网络结构研究意义

一个系统的结构、一个网络的结构与它的功能密切相关。我们大家可以想象一下,我们要想解决一个城市里面的道路交通堵塞的问题,首先必须要对现有的城市交通道路的布局有一个非常清晰、完整的了解,否则的话很难想象我们能够很好解决道路堵塞的问题。像时尚病毒在我们人类自身构成的网络当中的传播,也与我们人类社会的日益网络化相关的,病毒的传播也是与互联网的网络化相关的,所以我们之所以研究网络结构,就是结构与功能之间有着密切的关系。

2 复杂网络结构的特性

2.1复杂网络的描述语言

这样一种共同的语言,应该说是由伟大的数学家欧拉在十八世纪就给我们建立了。欧拉当时建立这种语言所研究的问题,就是起源于当时俄国的一个小镇,有点类似江南水乡的特征,有一些河流,总共建了7座桥,小镇的人就关心这样的问题,就是能不能找到一条行走路线,能够路过所有的桥,并且每座桥只能经过一次,小镇的人反复尝试也没有找到这样的路线,后来欧拉发现这样的路径是不存在的。那么欧拉发现这个问题基本的手段,就是把这个问题用一个抽象的图来表示,具体就是把这些河流分割开的四个陆地区域,每一个区域用一个结点来表示,而把桥梁当成连接这些结点的连线,今天这样一种图的表示方法,就成为我们表述复杂网络一种共同的语言。

比如说对Internet而言,那么我们每一个结点就可以表示一个路由器,如果连个结点之间直接通过光纤连接就有一个光纤。

对人类社会关系网络而言,我们每一个人就是一个结点,两个人如果是朋友关系,那么这两个人之间就有这样一条边直接相连。

用规则的图来表示复杂网络的结构。常用规则的图比如假设所有的两个结点都是直接互相相连的,当然这不符合许多实际网络,互联网上不可能所有两个路由器都是直接相连的,而我们人类不可能所有两个人之间都是朋友关系。那么另外一种描述就是假设网络当中一个结点只与他周围的几个结点相连,也就是说因为朋友关系,假设我们每一个人他的朋友只在他的周围,就是没有远距离的朋友,当然这也并不太符合事实,实际上我们很多人也有个别的朋友是远在异国他乡的,因此实际的网络并不是完全规则的网络。在这样完全规则的图表示另外一个极端,就是完全随机的网络,也就是我们假设这个网络两个结点之间是否存在连接,是靠抛硬币决定,硬币正面朝上就有连接,背面朝上就没有连接,两个结点是完全随机连接在一起的,当然这种完全随机的描述方式,也不符合我们实际网络的特性。以互联网为例,网络服务供应商他们选择他们的路由器和外面的路由器相连的时候,显然不是通过抛硬币、抛石子决定的,所以实际上的复杂网络不是随机的也不是规则的。那么到底复杂网络他们在结构上有哪些重要的特征呢?在过去几年来,从1998年以来,不同领域的科学家们在对复杂网络的结构特征的研究上面,取得了不少的进展,在很大程度上,应该归功于我们有了强大的计算能力,使得我们对许多大型的复杂网络的数据做统计分析,这在没有强大的计算机以前是不可能做到的。

3.复杂网络结构性质的研究

归为以下这三个方面:

1)网络的聚类特性。

2)尽管网络结点很多,但是是不是真的很大,它到底有多小。

3)网络当中的结点与结点是否平等。事实上可以归为这三个问题。

3.1 聚类特性

用一句成语就是网络物以类聚、人以群分的关系,以朋友关系网络而言的话,那么我的朋友圈的聚类系数是什么?就是我在我的朋友圈当中,任意随机找两个朋友,我看这两个朋友他们两个人之间也互相是朋友的概率是多大。我们根据我们日常经验来看,事实上我的朋友大部分都是我的同事、同学、邻居,所以他们相互为朋友的概率事实上也是不小的,而一个网络如果它真的是完全随机的,那么我的朋友当中两个人互相为朋友的概率应该是很小的,所以说实际的复杂网络,它并不是完全随机的,而是具有比完全随机网络高得多的聚类的特性,这是最近几年来人们通过对许多大型的实际的复杂网络的数据做统计分析得到的结论,就是与完全随机的网络相比,我们的网络具有高得多的聚类效应,确实是物以类聚,人以群分,这是一个特性。

3.2 小世界特征

对以下的例子,我们可以发现小世界这样一种特征,是不同类型的复杂网络所共有的一种特征,也就是说这些不同类型的复杂网络,尽管他们的规模都很大,但是两个结点之间的距离比我们想象得要小得多。

另外一个特性,这些网络看上去都很大,那么我们从反方面来说,它到底有多小呢?我们要看它有多小,我们就要有具体的概念来刻划,一个网络当中两个结点之间的距离我们定义为从这个结点到那个结点所需要的最小的边数,我们就称为这两个结点之间的距离。一个网络的平均距离就是网络所有的结点距离,我们取平均值,过去几年来人们对众多不同的复杂网络进行分析发现这些网络虽然大,但是实际上这些网络都是惊人的小,同样以人类自身的网络为例的话,实际上在二十世纪六十年代美国一个社会科学家就通过一系列的实验发现在我们地球上随机找两个人,这两个人之间,从平均的意义上来讲,这两个人通过六层朋友关系就能拉上关系,这就是社会学上的所谓六度分割原理,这样的六度分割原理,我想绝大部分的人都有这样的体验。比如说我们有的时候在一起吃饭的时候,原来这两个人是互相不认识的,但是大家聊一聊、谈一谈就发现你认识甲先生,而甲先生是我的好朋友,聊一聊就会拉上关系,大家都会有这个体会,常常说这个世界真小,这实际上就是反映我们人类社会小世界的特征。那么事实上具有这种小世界特征的网络绝不是人类社会本身这个网络一个。在前几年,美国的科学家们把好莱坞所有老的电影演员拿来做实验,比如说一个演员是一个结点,两个演员他们合作在同一部电影演出,划一个边,通过所有演员分析表明,平均来讲两个演员之间的距离比6还小,也就是34的样子。

以万维网为例,万维网在1999年统计大概是10亿的数量级,那么美国一些物理学家就设计了一种软件,通过这个软件对万维网做数据采集分析发现,万维网中的平均距离是19个连接,这是什么概念?就是说你在互联网上随机任意取两点,不断 点这上面的超级链节按19次鼠标就能到达另一点,这就是万维网小世界特征。

以互联网为例,我们路由器的数量已经是数以几十万计,但是平均两个路由器之间的距离也就是10左右。

以食物链为例子,科学家发现,对食物链网络而言,两个物种的距离只有2,

以我们生物体当中的新陈代谢网络而言,科学家发现,大量的新陈代谢网络都是小世界网络,它们平均距离都是3左右,惊人得小。通过一个很小的动物,就是鲁虫,这个动物的神经源距离是14、

我们人类的语言,我们每天都在使用不同的语言讲话,也许大家没有想到过我们人类的语言也可以看作是一个复杂的网络。以英语为例,我们可以把每一个单词看做是一个结点,如果两个单词它们在同一个句子当中出现过,我们就认为这两个单词之间是直接关联的,就加一个边,这样我们可以把语言看作是一个复杂的网络。通过对英语的统计分析,两个单词之间的平均距离,实际上只有2至3。

以我们电子线路为例,我们一块电路板上往往都有很多的元件,如果两个元件之间有两个联线相连,就画一条边,我们发现电路板上的平均距离也只有4。

回到我们科研人员本身,我们谈一下科研合作网络,实际上在对SARS病毒的研究方面,我们之所以能够在这么短的几个月里面,对SARS的研究方面,应该说还是取得了很大的进展,很大的程度上应该归功于我们能够迅速组织起来的科研合作网络,在这里我们可以看到一个科研合作网络的每一个科学家、每一个科研人员,我们把他们看作一个结点,如果两个科学家、两个科研人员合作发表过一篇文章的话,我们就把这两个结点画一条边,这样我们就可以得到一个科学合作网络,研究人员通过对不同学科、不同领域的科学合作网络所做的统计分析发现,这些科学合作网络都具有小世界的特征,也就是说两个科学家之间平均距离也是在4至9之间,也是很惊人得小。

比如说在数学史上,最多产的一个科学家,二十世纪最著名的科学家阿尔多斯,他一生发表过一千多篇文章,我查到我和他的平均距离,实际上惊人得小,只有3。

为什么实际的复杂网络都具有这样一种小世界的特征?这方面突破性的进展,是在1998年美国康乃尔大学的导师和学生提出来小世界模型。他们小世界模型首先是从一个规则的,但是局部连接的网络开始的,如果我们把这个网络看成是朋友关系网络的话,就是说左边局部规则的网络,就是假设每个人的朋友都在我的周围,如果我们的朋友关系真是这样的网络的话,那么这样的网络具有很高的聚类特性,但是它是大世界,就是全世界人口有70亿的话,从这个顶点到另外一个顶点的距离,跟我们人类的数量是相等的,所以这是一个大世界。那么他们通过研究发现,我们只要在这样一个局部连接网络当中,引入非常少量的长城连接,就可以使原来大世界的网络,变成一个小世界的网络,也就是说可以使两个人之间的距离变得非常小。以朋友关系为例,就是说我们只要有少量的人,他具有少量远在异国他乡的朋友的话,就能使我们整个人类变成一个小世界的网络。

 

我们前面谈到了实际网络具有比较高的聚类效应,而且实际网络尽管它们的规模都很大,但是其实它们也有很小的方面。下面我们看一看实际的网络当中,结点与结点之间在地位上是否平等呢?要表述这个问题就要引出另外一个概念,就是度分布的概念,所谓一个网络结点分布的话,就是你有多少个朋友,这个K就是你的度,那么什么叫做度分布的概念?就是说我们以朋友网络关系而言,我们随机找一个人看看他有K个朋友的概率是多大,这个概率就是这个网络的度分布。那么我们研究人员在过去几年里面,在对复杂网络的度分布上面,发现了什么样的特征呢?我们学过概率统计的朋友可能都知道,我们最常用的分布,就是我们科研人员最常用的分布就是正态分布,具有这种分布的网络,它具有一个明显的特征长度K,就是以我们这个城市。

以我们高速公路网为例,那么通过每一个大城市的高速公路数目应该来说差别都不太大,就是不可能说一个城市有几百条高速公路都穿过这个城市,那么航空交通网就大不一样,右边是美国航空交通网的图,很多机场实际上都是不大的,每天的航班数目都不太多,但是有少量的大的机场它几乎每分钟都有飞机不停地在升起降下,比如说芝加哥、亚特兰大、纽约等等,对网络连接起很重要的作用,就是把这几个大机场关闭,整个航空交通网络就会瘫痪。那么我们只是关掉小的机场的话,可以说对整个航空交通网络是没有影响的,所以航空交通网跟城市的高速公路交通网是有很大的区别。

那么研究人员通过对许多实际网络的研究,就发现许多实际网络都具有像航空交通网的性质,就是这种网络它的连接度分布是一种我们称之为PK的分布,就是K的幂次方,具有这种幂度的分布网络,由于没有明显的特征长度,所以我们称之为五次度网络。

以互联网为例,就是五次度网络,大量的路由器只有少量的路由器连接,但是大量的互联网路由器与众多的其他的路由器相连接。对这种互联网的五次度网络特征发现,也影响到了我们对互联网突破结构发生器的研究工作,大家知道,我们互联网的规模发展到今天这么大,我们有了一种新的想法,我们是不可能立即在实际的网络上面做实验,我们往往都要做大量的仿真实验,而这些仿真实验效果怎么样,很大程度上取决于我们互联网仿真模型是否与实际的互联网相符合。

运行在互联网上的万维网,也是具有五次度特性的网络。那么万维网实际上是一种有向的网络,为什么称为是有向的网络?就是说万维网就像我的主页上有一些超级链节,比如说我有一个指向新浪网的主页,但是新浪网上面没有指向我的主页,所以我们可以画出两张地图,就是只考虑每一个出去的网络,另外一个就是只考虑有多少个外面的指向它,通过对两张地图的统计发现,都具有五次度特征。这种五次度特征表示万维网什么特性?就是不规则的特性。像我的个人主页很少有别的主页能够加上我的个人主业的超级链接,而成千上万能够指向新浪网的超级链接。很多新陈代谢的网络也具有这种五次度特征,有一篇文章提到在癌症上面非常重要的网络叫P53网络,就提到这样一个观点,我们理解P53网络一种方式就是把它与互联网相比较,细胞和互联网一样也具有五次度的特征。我们科学引用网络而言,即我们把每发表的一篇文章当做一个结点,文章后面参考文献,就构成了文章与文章之间相互引用关系,组成了科学引用网络,研究人员发现,对不同学科而言,这种科学引用网络都具有这种五次度特征。

通过这些例子,我们就要问,像复杂网络当中哪些少量大的结点是怎么产生的?为什么这些复杂网络它们的连接分布具有这种分布的特性?在1999年的时候,二个物理学家发表了一篇文章,就提出五次度网络模型,他们认为之所以复杂网络会产生这种五次度特性,是有两个很重要的机理:一个是网络不断增长的特性,也就是我们万维网上每天都有新的站点产生,以科研人员为例,就是有不同的科研成果加进来;第二就是网络结点优先连接特点,就是富的人更富这样的特性。这是什么意思?比如说以万维网为言,我在建立我个人主页的时候,我在我个人主页建立超级链接,主要先想到新浪、雅虎这样著名的站点,越具有高知名度的结点,后面的结点越想跟他们连接,就是富的人越富。发表文章我们参考的时候,越是著名的文章我们大家越想引用它,就是这两个机理使得复杂网络具有五次度特性。这几年还有大量的研究,我们就不详细介绍了。

总的来看,关于复杂网络结构特征的研究,我们看到许多的实际网络尽管规模很大,但是还是比较紧密的联系在一起的,而且尽管它的规模很大,实际上结点与结点之间的距离远比我们想象的小得多,也就是世界上也很小的,尽管网络规模很大,但是网络当中结点与结点之间的地位是不平等的,就是我们的网络世界实际上也是不平等的,就是归纳起来就是这样三种主要的特性。

3.3鲁棒性

研究网络的这些结构上的特征本身并不是我们的目的,我们的目的是想看看这些结构上的特征与网络的行为之间到底有什么样的关系,或者说网络的结构是怎么样影响网络的行为的?这里我们简单谈一下三个方面:网络的脆弱性;网络上的统分化行为;网络上的病毒传播机制。

一个系统,一个网络,它的某个脆弱的方面,我们在科学方面通常也把它称为这个系统的阿基尼斯的脚后跟,为什么称为阿基尼斯脚后跟,阿基尼斯是古希腊出生的一个英雄,他的母亲把他放在禁河里,所以就力大无穷,他母亲是抓着他的脚后跟放入禁河,只有脚后跟是凡人,别人就射他的脚后跟,所以我们称之为阿基尼斯的脚后跟。Internet的阿基尼斯脚后跟,在这期发表的文章当中,就研究了具有五次度特征的复杂网络,它的鲁棒性和脆弱性,就是把这个网络的一些结点去掉,这个网络是否还是一个完整的网络。以互联网为例,我们互联网的前身是具有几个结点的网络演变而来的,美国国防部当时在设计这个网络的时候,一个很重要的因素就是希望我这个网络在受到苏联攻击的时候,它仍然能够保持通信的畅通,互联网现在发展成为这样巨大的网络,是否还具有鲁棒性,对数据仿真研究发现,确实我们的互联网它对随机性的鼓掌具有非常高的鲁棒性,这实际上也是与我们今天的现实相符合,我们每天都在使用互联网,也许我们没有注意到在互联网上每天都有数以百计的路由器在发生故障,而我们普通用户都没有感觉到这些故障,我们还能在互联网上冲浪,这就是互联网高度容忍的随机性和鲁棒性,为什么互联网有这样的鲁棒性?研究认为互联网路由器具有的五次度特征有关系,也就是互联网上有少量的路由器,它们与其他众多的路由器相关联,这些少量的路由器只要能正常运行,就能保证整个Internet能够正常运行。但是从另外一个方面来讲,正是由于少量的结点,它对整个网络运行所起的重要的作用,也使得我们互联网对恶意的攻击具有很强的脆弱性,也就是说如果我要使我们的互联网陷入瘫痪的话,我只要对哪些少量的连接度很高的结点,只要使不超过5%的结点瘫痪的话,就可以使Internet瘫痪,这也是它不利的一个方面。那篇文章的观点就认为这种复杂网络对随机性故障的鲁棒性和对恶意攻击的脆弱性是五次度特征的共性。而事实上,近些年不同领域的科学家对不同事物进行研究分析,鲁棒当同时脆弱是复杂网络最重要的特征,比如说航天飞机,我们设计航天飞机的时候,显然我们总是失望,对我们能够想到的各种干扰,我们希望航空飞机能够顺利回到地面,但是我们还是不幸出现了哥伦比亚号的灾难,就是实际的复杂系统既具有鲁棒性,也具有脆弱性的一面。

3.4网络同步

实际上同步化现象是宇宙当中最朴实的现象,对同步化在科学上做研究,可以追溯到十九世纪一个科学家,他发现两个挂钟在一个地方,一个时期以后就会是同步,而以前是不同步的。

比如说夏天有一棵树上有很多的萤火虫,可能一开始闪灭的时间都不同,但是一段时间以后就可以同时闪灭,就像手电筒一开一关一样。

窗外蟋蟀叫响的声音是不同的,但是过一段时间就会听到蟋蟀同时叫,同时不叫。

演讲的时候,观众都要给以掌声,但是最初几秒钟大家的掌声比较杂乱,但是很快过了几秒钟我们的掌声就会非常整齐一致。

2001年发表的一篇文章就是探讨议会中这些观众的掌声一开始不同步,几秒钟以后就会同步。

在高科技领域也有很多同步化的现象,比如说路由器振荡的同步。

激光之所以有可能产生,就是因为数以万以计的原子,它们同时释放出具有同样的分子产生的。

同步并不都是有利的,在很多场合同步也是有害的,比如说英国在为了迎接新千年的到来,建立了一座千年大桥,开放后不久有一天晚上,这个大桥上面人数众多,大家走路又产生了某种共振,使千年大桥发生了剧烈的晃动,迫使工作人员不得不把这座大桥关闭,这就是同步化造成的危害。

以互联网为例,普通公众没有意识到互联网上有多少同步化的危害,比如说互联网上的路由器,每一个路由器都要周期性的发布路由消息,而尽管各个路由器它都是自己来决定它什么时候发布路由消息的,但是研究人员发现不同路由器它们发送路由消息,最终会达到同步化现象,也就是大家要不同时发布路由消息,要不发布,这显然对网络的拥塞,这都是不利的行为。

前面谈到同步化的行为,科学家就想到这些不同类型的复杂网络为什么会产生这些同步化的现象,就是在不同类型的同步化现象背后共同的特征是什么?特别是近几年人们也把同步化现象产生与复杂网络突破结构结合起来,在这方面通过研究,我们就发现如果一个复杂网络当中,任何两个结点之间,都是直接相连的话,那么只要这个网络的规模足够大的话,这个网络之间的结点必然会产生同步化现象。而对于一个只有局部相连的规则网络而言,对这个网络而言,不管两个结点之间的连接强度有多大,只要网络规模足够大的话,这样的网络是不可能达到同步的。

而我们关于小世界网络的研究,我们发现只要在原来局部规则网络的基础上,引入少量的几个长城链接,就能够显著改善网络同步化的能力。

对五次度网络同步化的实验表明,由于网络的非均匀特性,就是少量结点在五次度网络的作用,相当于几个结点起作用,这样使得五次度网络与新型网络类似同步化的能力也是非常强的,所以说这就在一定程度上解释了为什么许多复杂网络它都具有一种同步化的趋势。

3.5网络传播

复杂网络传播现象,也就是最初一个局部的小的故障,小的扰动是怎么在网络当中传播的,怎么样最终影响整个网络系统行为的。

例如,由于狂风暴雨,使得某一个地方的电线杆倒了,这就有可能在很短时间内导致一片城区都断电,这就是电力网中的连锁故障。

经济活动为例,最简单的例子就是亚洲金融危机,在1997年亚洲金融危机发生之前,那些发生危机的国家它们的经济建立了长达十几年的经济增长,所以普遍抱有乐观的态度,以泰国改变汇率制度为导火索,在短短数周内,就影响了韩国、东南亚、香港等等,引起了亚洲金融危机,这个危机固然于经济的网络化不断加深有关,另外一方面也与我们对这样一种局部性的事件,在这样一种经济复杂网络当中所能够造成的这样大的传播估计不足,准备不足有关系。

病毒的传播,像艾滋病、SARS这样的病毒,最初只有一两个人,少数几个人得,为什么会逐渐在我们人类当中传播开来,这样病毒在我们人类之间传播,与我们人类之间的连接到底存在什么关系?

计算机的病毒如何在互联网上传播的?

应该来说,在过去很多年间,科学家们在对传染病传播机理研究方面,应该说取得了不少的进展,也建立了不少传染病的模型,但是我想今后如果我们在研究这些病毒,不管是在人类网络当中传播也好,还是在互联网上传播也好,我们在研究这些传播机理的时候,如果能够考虑到复杂网络在结构上的一些特征的话,也许能够使得我们有更好的预防和控制这些病毒传播的方法。

我在去年看到一篇没有发表的文章,就谈到如果我们人类网络确实是具有这种五次度的特征的话,那么在艾滋病疫苗没有出现之前,也许预防艾滋病最好的办法,就是把那些少量的重要结点,就是对传播具有重要结点的人隔离起来,也许是最好的办法。对这次SARS我们采取隔离的办法,也是因为这一点,隔离确实是最好的办法。

复杂网络是比比皆是的,而众多不同类型的网络背后确实是存在着某种共性的结构上的特征的,网络结构上的特征确实与网络的性能密切相关。

网络当中的同步化现象,在很多场合是有利的,像同步在通信当中就起很重要的作用,但是确实在有些场合,应该来说也是有害的。比如互联网中的路由器,它们发生周期性的路由消息,就会发生这种同步化的现象,这种同步化的现象,就是网络研究人员所希望能够避免的。在互联网上,目前避免路由器同步所采用的方法,就是网络专家在九十年代提出的,在每个路由器当中假如随机性的因素,这就是互联网当中路由器引入随机早期检测的机制,引入这样一个随机性的因素之后,实际上现在看起来并不能完全避免互联网上有害的同步化现象,我们往往发现一种同步化现象避免,另外一种同步化现象又产生了,所以怎么样针对复杂网络在同步有害的时候,能够有效的避免它,到目前为止还是值得进一步研究的课题,这也是我们关注的一个课题。


展开阅读全文

没有更多推荐了,返回首页