复杂网络问答

管延放

各位同学,各位老师,大家好。今天非常高兴邀请到的嘉宾是上海交通大学自动化系教授、博士生导师汪小帆教授,今天演讲的题目是复杂网络研究的主要进展。下面我介绍一下汪小帆教授。1996年于东南大学自动化所控制理论与控制工程专业获博士学位。现为上海交通大学自动化系责任教授、博士生导师,2002年国家杰出青年科技基金获得者。多次应邀在国内外学术会议及大学作大会报告和学术讲座。下面有请汪老师。

汪小帆

大家下午好,很高兴有这样的机会通过互联网跟大家做学术交流,我想在抗击非典的特殊时期里面,我们更加感谢了飞速发展的互联网给我们的经济、生活所带来的重要的影响和所起的重要的作用。事实上今天来看,我们即使在这段时间很少出门,我们也能够很容易做到秀才不出门,遍知天下事。今后我们想出门的时候,我们通过四通八达的交通网络和交通工具,也可以很容易从地球的一边到另外一边,这都是日益的网络化给我们带来的巨大好处。当然任何事物都有两重性,像SARS这样的病毒,之所以能够在我们的人类中,几个月之内流传得这么广,事实上也是与我们人类交往的日益频繁,人类社会网络化程度的不断加高所密切相关的。不管是互联网还是人类自身的网络,他们都有共同的特点,就是这些网络都是很复杂,都是由数量极大的结点相互联系而构成的。今天我想跟大家交流的就是我们想看一看这些不同类型的网络之间,他们有些什么共同的特征,对这些网络的共同特征的了解,是否有助于帮助我们更好的认识这些网络的行为,并进而改善网络的性能,使得我们人类的生活更好。

我的报告分为这样三个部分。首先我想跟大家简单谈一下到底什么是复杂网络?其次我们想和大家介绍一下最近几年来,科学家对复杂网络研究上面所取得的主要的进展;最后我想跟大家谈一下复杂网络结构上的特征与复杂网络的性能之间的关系。

首先谈一下什么是复杂网络?对普通人而言,在媒体上看到复杂网络,首先想到的是互联网,实际上网络已经成为Internet的代名词,确实Internet从只有几个结点的简单的网络,发展到今天Internet的用户已经数以亿计,即使不考虑终端用户,路由器的用户也是几万人,确实是复杂的网络,而且对互联网我们缺少统一的行政管理机构,可以说到今天已经没有任何一个人能够知道互联网上所有的路由器到底是怎么联结在一起,就是没有互联网联结一张很完整的清晰的地图。世界上除了互联网以外,复杂网络的例子在我们生活中比比皆是,比如说我们把一个万维网做为一个结点,可以说至少和我们人类的数目相当的,所以万维网也是极其复杂的网络。就拿我们人体而言,我们人体当中实际上有各种各样的复杂网络,我们大脑当中的神经网络,实际上就是有数量高于十次方以上大量的神经源互相连接在一起,我们人体还有各种各样的新陈代谢网络。那么一条江河里面食物链构成的食物链也是网络,甚至大型软件系统都可以看成是小的对象类通过互相调用构成的复杂网络,因此可以说绝大部分的事物都可以看成是复杂网络。

那么我们说一个网络复杂,它的复杂性到底体现在哪些方面?首先第一直观而言,就是网络的结构非常复杂,比如说互联网、路由器和路由器怎么连接,我们没有很清晰、很规则的概念;其次网络是不断演化的,以互联网而言,网络上我们可以说路由器是不断地增加,路由器与路由器之间的连接也是不断增长的;还有一个就是连接的多样性。就像人类朋友的关系,朋友也有亲密和疏远之分;还有网络动力学的复杂性,互联网每一个路由器的动力行为,实际上都是在不停地变化,而且不同的结点都有不同的动力行为,这些都是网络复杂的因素。今天我想跟大家交流的是关于网络结构上的复杂性。那么在研究网络结构的复杂性之前,我们首先想要关心的一个问题就是我们为什么要研究网络的结构?一个最主要的理由一个系统的结构、一个网络的结构与它的功能密切相关。我们大家可以想象一下,我们要想解决一个城市里面的道路交通堵塞的问题,我们首先必须要对现有的城市交通道路的布局有一个非常清晰、完整的了解,否则的话很难想象我们能够很好解决道路堵塞的问题。像时尚病毒在我们人类自身构成的网络当中的传播,也与我们人类社会的日益网络化相关的,病毒的传播也是与互联网的网络化相关的,所以我们之所以研究网络结构,就是结构与功能之间有着密切的关系。

下面就介绍一下复杂网络结构上的一些特性。那么要研究不同类型的复杂网络在结构上面共同的特征的话,我们首先要找到一种描述这种不同类型复杂网络的共同语言,这样一种共同的语言,应该说是由伟大的数学家欧拉在十八世纪就给我们建立了。欧拉当时建立这种语言所研究的问题,就是起源于当时俄国的一个小镇,有点类似江南水乡的特征,有一些河流,总共建了7座桥,小镇的人就关心这样的问题,就是能不能找到一条行走路线,能够路过所有的桥,并且每座桥只能经过一次,小镇的人反复尝试也没有找到这样的路线,后来欧拉发现这样的路径是不存在的。那么欧拉发现这个问题基本的手段,就是把这个问题用一个抽象的图来表示,具体就是把这些河流分割开的四个陆地区域,每一个区域用一个结点来表示,而把桥梁当成连接这些结点的连线,今天这样一种图的表示方法,就成为我们表述复杂网络一种共同的语言。比如说对Internet而言,那么我们每一个结点就可以表示一个路由器,如果连个结点之间直接通过光纤连接就有一个光纤,以我们人类社会关系网络而言,我们每一个人就是一个结点,两个人如果是朋友关系,那么这两个人之间就有这样一条边直接相连,这样就是说我们尽管世界网络的类型是千差万别的,但是我们可以用共同的语言,就是图把复杂网络描述出来。那么找到这样共同语言之后,我们就来看,一个复杂网络它的最简单的结构是什么?人们首先都是从最简单的地方开始着手研究。

那么我们首先想到的就是用规则的图来表示复杂网络的结构。常用规则的图比如假设所有的两个结点都是直接互相相连的,当然这不符合许多实际网络,互联网上不可能所有两个路由器都是直接相连的,而我们人类不可能所有两个人之间都是朋友关系。那么另外一种描述就是假设网络当中一个结点只与他周围的几个结点相连,也就是说因为朋友关系,假设我们每一个人他的朋友只在他的周围,就是没有远距离的朋友,当然这也并不太符合事实,实际上我们很多人也有个别的朋友是远在异国他乡的的,因此实际的网络并不是完全规则的网络。在这样完全规则的图表示另外一个极端,就是完全随机的网络,也就是我们假设这个网络两个结点之间是否存在连接,是靠抛硬币决定,硬币正面朝上就有连接,背面朝上就没有连接,两个结点是完全随机连接在一起的,当然这种完全随机的描述方式,也不符合我们实际网络的特性。以互联网为例,网络服务供应商他们选择他们的路由器和外面的路由器相连的时候,显然不是通过抛硬币、抛石子决定的,所以实际上的复杂网络不是随机的也不是规则的。那么到底复杂网络他们在结构上有哪些重要的特征呢?在过去几年来,从1998年以来,不同领域的科学家们在对复杂网络的结构特征的研究上面,取得了不少的进展,在很大程度上,应该归功于我们有了强大的计算能力,使得我们对许多大型的复杂网络的数据做统计分析,这在没有强大的计算机以前是不可能做到的。

关于复杂网络突破结构性质的研究,进展有很多,但重要的方面,可以归为以下这三个方面:

1、网络的聚类特性。

2、尽管网络结点很多,但是是不是真的很大,它到底有多小。

3、网络当中的结点与结点是否平等。事实上可以归为这三个问题。

我们首先看一下网络聚类特性。用一句成语就是网络物以类聚、人以群分的关系,以朋友关系网络而言的话,那么我的朋友圈的聚类系数是什么?就是我在我的朋友圈当中,任意随机找两个朋友,我看这两个朋友他们两个人之间也互相是朋友的概率是多大。我们根据我们日常经验来看,事实上我的朋友大部分都是我的同事、同学、邻居,所以他们相互为朋友的概率事实上也是不小的,而一个网络如果它真的是完全随机的,那么我的朋友当中两个人互相为朋友的概率应该是很小的,所以说实际的复杂网络,它并不是完全随机的,而是具有比完全随机网络高得多的聚类的特性,这是最近几年来人们通过对许多大型的实际的复杂网络的数据做统计分析得到的结论,就是与完全随机的网络相比,我们的网络具有高得多的聚类效应,确实是物以类聚,人以群分,这是一个特性。

另外一个特性,这些网络看上去都很大,那么我们从反方面来说,它到底有多小呢?我们要看它有多小,我们就要有具体的概念来刻划,一个网络当中两个结点之间的距离我们定义为从这个结点到那个结点所需要的最小的边数,我们就称为这两个结点之间的距离。一个网络的平均距离就是网络所有的结点距离,我们取平均值,过去几年来人们对众多不同的复杂网络进行分析发现这些网络虽然大,但是实际上这些网络都是惊人的小,同样以人类自身的网络为例的话,实际上在二十世纪六十年代美国一个社会科学家就通过一系列的实验发现在我们地球上随机找两个人,这两个人之间,从平均的意义上来讲,这两个人通过六层朋友关系就能拉上关系,这就是社会学上的所谓六度分割原理,这样的六度分割原理,我想绝大部分的人都有这样的体验。比如说我们有的时候在一起吃饭的时候,原来这两个人是互相不认识的,但是大家聊一聊、谈一谈就发现你认识甲先生,而甲先生是我的好朋友,聊一聊就会拉上关系,大家都会有这个体会,常常说这个世界真小,这实际上就是反映我们人类社会小世界的特征。那么事实上具有这种小世界特征的网络绝不是人类社会本身这个网络一个。在前几年,美国的科学家们把好莱坞所有老的电影演员拿来做实验,比如说一个演员是一个结点,两个演员他们合作在同一部电影演出,划一个边,通过所有演员分析表明,平均来讲两个演员之间的距离比6还小,也就是3至4的样子。以万维网为例,万维网在1999年统计大概是10亿的数量级,那么美国一些物理学家就设计了一种软件,通过这个软件对万维网做数据采集分析发现,万维网中的平均距离是19个连接,这是什么概念?就是说你在互联网上随机任意取两点,不断点这上面的超级链节按19次鼠标就能到达另一点,这就是万维网小世界特征。以互联网为例,我们路由器的数量已经是数以几十万计,但是平均两个路由器之间的距离也就是10左右。以食物链为例子,科学家发现,对食物链网络而言,两个物种的距离只有2,以我们生物体当中的新陈代谢网络而言,科学家发现,大量的新陈代谢网络都是小世界网络,它们平均距离都是3左右,惊人得小。通过一个很小的动物,就是鲁虫,这个动物的神经源距离是14,我们人类的语言,我们每天都在使用不同的语言讲话,也许大家没有想到过我们人类的语言也可以看做是一个复杂的网络。以英语为例,我们可以把每一个单词看做是一个结点,如果两个单词它们在同一个句子当中出现过,我们就认为这两个单词之间是直接关联的,就加一个边,这样我们可以把语言看做是一个复杂的网络。通过对英语的统计分析,两个单词之间的平均距离,实际上只有2至3。以我们电子线路为例,我们一块电路板上往往都有很多的元件,如果两个元件之间有两个联线相连,就画一条边,我们发现电路板上的平均距离也只有4。回到我们科研人员本身,我们谈一下科研合作网络,实际上在对SARS病毒的研究方面,我们之所以能够在这么短的几个月里面,对SARS的研究方面,应该说还是取得了很大的进展,很大的程度上应该归功于我们能够迅速组织起来的科研合作网络,在这里我们可以看到一个科研合作网络的每一个科学家、每一个科研人员,我们把他们看作一个结点,如果两个科学家、两个科研人员合作发表过一篇文章的话,我们就把这两个结点画一条边,这样我们就可以得到一个科学合作网络,研究人员通过对不同学科、不同领域的科学合作网络所做的统计分析发现,这些科学合作网络都具有小世界的特征,也就是说两个科学家之间平均距离也是在4至9之间,也是很惊人得小。比如说在数学史上,最多产的一个科学家,二十世纪最著名的科学家阿尔多斯,他一生发表过一千多篇文章,我查到我和他的平均距离,实际上惊人得小,只有3。

那么通过对以上这些例子,我们可以发现小世界这样一种特征,是不同类型的复杂网络所共有的一种特征,也就是说这些不同类型的复杂网络,尽管他们的规模都很大,但是两个结点之间的距离比我们想象得要小得多。

我们就要问为什么?为什么实际的复杂网络都具有这样一种小世界的特征?这方面突破性的进展,是在1998年美国康乃尔大学的导师和学生提出来小世界模型。他们小世界模型首先是从一个规则的,但是是局部连接的网络开始的,如果我们把这个网络看成是朋友关系网络的话,就是说左边局部规则的网络,就是假设每个人的朋友都在我的周围,如果我们的朋友关系真是这样的网络的话,那么这样的网络具有很高的聚类特性,但是它是大世界,就是全世界人口有70亿的话,从这个顶点到另外一个顶点的距离,跟我们人类的数量是相等的,所以这是一个大世界。那么他们通过研究发现,我们只要在这样一个局部连接网络当中,引入非常少量的长城连接,就可以使原来大世界的网络,变成一个小世界的网络,也就是说可以使两个人之间的距离变得非常小。以朋友关系为例,就是说我们只要有少量的人,他具有少量远在异国他乡的朋友的话,就能使我们整个人类变成一个小世界的网络。

我们前面谈到了实际网络具有比较高的聚类效应,而且实际网络尽管它们的规模都很大,但是其实它们也有很小的方面。下面我们看一看实际的网络当中,结点与结点之间在地位上是否平等呢?要表述这个问题就要引出另外一个概念,就是度分布的概念,所谓一个网络结点分布的话,就是你有多少个朋友,这个K就是你的度,那么什么叫做度分布的概念?就是说我们以朋友网络关系而言,我们随机找一个人看看他有K个朋友的概率是多大,这个概率就是这个网络的度分布。那么我们研究人员在过去几年里面,在对复杂网络的度分布上面,发现了什么样的特征呢?我们学过概率统计的朋友可能都知道,我们最常用的分布,就是我们科研人员最常用的分布就是正态分布,具有这种分布的网络,它具有一个明显的特征长度K,就是以我们这个城市,以我们高速公路网为例,那么通过每一个大城市的高速公路数目应该来说差别都不太大,就是不可能说一个城市有几百条高速公路都穿过这个城市,那么航空交通网就大不一样,右边是美国航空交通网的图,很多机场实际上都是不大的,每天的航班数目都不太多,但是有少量的大的机场它几乎每分钟都有飞机不停地在升起降下,比如说芝加哥、亚特兰大、纽约等等,对网络连接起很重要的作用,就是把这几个大机场关闭,整个航空交通网络就会瘫痪。那么我们只是关掉小的机场的话,可以说对整个航空交通网络是没有影响的,所以航空交通网跟城市的高速公路交通网是有很大的区别。那么研究人员通过对许多实际网络的研究,就发现许多实际网络都具有像航空交通网的性质,就是这种网络它的连接度分布是一种我们称之为PK的分布,就是K的幂次方,具有这种幂度的分布网络,由于没有明显的特征长度,所以我们称之为五次度网络。我们以互联网为例,就是五次度网络,大量的路由器只有少量的路由器连接,但是大量的互联网路由器与众多的其他的路由器相连接。对这种互联网的五次度网络特征发现,也影响到了我们对互联网突破结构发生器的研究工作,大家知道,我们互联网的规模发展到今天这么大,我们有了一种新的想法,我们是不可能立即在实际的网络上面做实验,我们往往都要做大量的仿真实验,而这些仿真实验效果怎么样,很大程度上取决于我们互联网仿真模型是否与实际的互联网相符合。

运行在互联网上的万维网,也是具有五次度特性的网络。那么万维网实际上是一种有向的网络,为什么称为是有向的网络?就是说万维网就像我的主页上有一些超级链节,比如说我有一个指向新浪网的主页,但是新浪网上面没有指向我的主页,所以我们可以画出两张地图,就是只考虑每一个出去的网络,另外一个就是只考虑有多少个外面的指向它,通过对两张地图的统计发现,都具有五次度特征。这种五次度特征表示万维网什么特性?就是不规则的特性。像我的个人主页很少有别的主页能够加上我的个人主业的超级链接,而成千上万能够指向新浪网的超级链接。很多新陈代谢的网络也具有这种五次度特征,有一篇文章提到在癌症上面非常重要的网络叫P53网络,就提到这样一个观点,我们理解P53网络一种方式就是把它与互联网相比较,细胞和互联网一样也具有五次度的特征。我们科学引用网络而言,即我们把每发表的一篇文章当做一个结点,文章后面参考文献,就构成了文章与文章之间相互引用关系,组成了科学引用网络,研究人员发现,对不同学科而言,这种科学引用网络都具有这种五次度特征。

通过这些例子,我们就要问,像复杂网络当中哪些少量大的结点是怎么产生的?为什么这些复杂网络它们的连接分布具有这种分布的特性?在1999年的时候,二个物理学家发表了一篇文章,就提出五次度网络模型,他们认为之所以复杂网络会产生这种五次度特性,是有两个很重要的机理:一个是网络不断增长的特性,也就是我们万维网上每天都有新的站点产生,以科研人员为例,就是有不同的科研成果加进来;第二就是网络结点优先连接特点,就是富的人更富这样的特性。这是什么意思?比如说以万维网为言,我在建立我个人主页的时候,我在我个人主页建立超级链接,主要先想到新浪、雅虎这样著名的站点,越具有高知名度的结点,后面的结点越想跟他们连接,就是富的人越富。发表文章我们参考的时候,越是著名的文章我们大家越想引用它,就是这两个机理使得复杂网络具有五次度特性。这几年还有大量的研究,我们就不详细介绍了。

总的来看,关于复杂网络结构特征的研究,我们看到许多的实际网络尽管规模很大,但是还是比较紧密的联系在一起的,而且尽管它的规模很大,实际上结点与结点之间的距离远比我们想象的小得多,也就是世界上也很小的,尽管网络规模很大,但是网络当中结点与结点之间的地位是不平等的,就是我们的网络世界实际上也是不平等的,就是归纳起来就是这样三种主要的特性。

研究网络的这些结构上的特征本身并不是我们的目的,我们的目的是想看看这些结构上的特征与网络的行为之间到底有什么样的关系,或者说网络的结构是怎么样影响网络的行为的?这里我们简单谈一下三个方面:网络的脆弱性;网络上的统分化行为;网络上的病毒传播机制。

一个系统,一个网络,它的某个脆弱的方面,我们在科学方面通常也把它称为这个系统的阿基尼斯的脚后跟,为什么称为阿基尼斯脚后跟,阿基尼斯是古希腊出生的一个英雄,他的母亲把他放在禁河里,所以就力大无穷,他母亲是抓着他的脚后跟放入禁河,只有脚后跟是凡人,别人就射他的脚后跟,所以我们称之为阿基尼斯的脚后跟。Internet的阿基尼斯脚后跟,在这期发表的文章当中,就研究了具有五次度特征的复杂网络,它的鲁棒性和脆弱性,就是把这个网络的一些结点去掉,这个网络是否还是一个完整的网络。以互联网为例,我们互联网的前身是具有几个结点的网络演变而来的,美国国防部当时在设计这个网络的时候,一个很重要的因素就是希望我这个网络在受到苏联攻击的时候,它仍然能够保持通信的畅通,互联网现在发展成为这样巨大的网络,是否还具有鲁棒性,对数据仿真研究发现,确实我们的互联网它对随机性的鼓掌具有非常高的鲁棒性,这实际上也是与我们今天的现实相符合,我们每天都在使用互联网,也许我们没有注意到在互联网上每天都有数以百计的路由器在发生故障,而我们普通用户都没有感觉到这些故障,我们还能在互联网上冲浪,这就是互联网高度容忍的随机性和鲁棒性,为什么互联网有这样的鲁棒性?研究认为互联网路由器具有的五次度特征有关系,也就是互联网上有少量的路由器,它们与其他众多的路由器相关联,这些少量的路由器只要能正常运行,就能保证整个Internet能够正常运行。但是从另外一个方面来讲,正是由于少量的结点,它对整个网络运行所起的重要的作用,也使得我们互联网对恶意的攻击具有很强的脆弱性,也就是说如果我要使我们的互联网陷入瘫痪的话,我只要对哪些少量的连接度很高的结点,只要使不超过5%的结点瘫痪的话,就可以使Internet瘫痪,这也是它不利的一个方面。那篇文章的观点就认为这种复杂网络对随机性故障的鲁棒性和对恶意攻击的脆弱性是五次度特征的共性。而事实上近些年不同领域的科学家对不同事物进行研究分析,鲁棒当同时脆弱是复杂网络最重要的特征,比如说航天飞机,我们设计航天飞机的时候,显然我们总是失望,对我们能够想到的各种干扰,我们希望航空飞机能够顺利回到地面,但是我们还是不幸出现了哥伦比亚号的灾难,就是实际的复杂系统既具有鲁棒性,也具有脆弱性的一面,这就给我们提醒我们设计系统的时候,我们也许无法宣称我们这个事物是尽善尽美的,我们只能说尽可能达到完美的地步,但是永远不可能提到尽善尽美。

下面我们再简单谈一下复杂网络很普遍的一个现象,就是网络当中结点之间的同步化行为。实际上同步化现象是宇宙当中最朴实的现象,对同步化在科学上做研究,可以追溯到十九世纪一个科学家,他发现两个挂钟在一个地方,一个时期以后就会是同步,而以前是不同步的。比如说夏天有一棵树上有很多的萤火虫,可能一开始闪灭的时间都不同,但是一段时间以后就可以同时闪灭,就像手电筒一开一关一样。我们听窗外蟋蟀叫响的声音是不同的,但是过一段时间就会听到蟋蟀同时叫,同时不叫。我们听演讲的时候,观众都要给以掌声,但是最初几秒钟大家的掌声比较杂乱,但是很快过了几秒钟我们的掌声就会非常整齐一致。2001年发表的一篇文章就是探讨议会中这些观众的掌声一开始不同步,几秒钟以后就会同步。在高科技领域也有很多同步化的现象,比如说路由器振荡的同步,还有日常大家都知道的激光,事实上激光之所以有可能产生,就是因为数以万以计的原子,它们同时释放出具有同样的分子产生的。当然同步也并不都是有利的,在很多场合同步也是有害的,比如说英国在为了迎接新千年的到来,建立了一座千年大桥,开放后不久有一天晚上,这个大桥上面人数众多,大家走路又产生了某种共振,使千年大桥发生了剧烈的晃动,迫使工作人员不得不把这座大桥关闭,这就是同步化造成的危害。以互联网为例,普通公众没有意识到互联网上有多少同步化的危害,比如说互联网上的路由器,每一个路由器都要周期性的发布路由消息,而尽管各个路由器它都是自己来决定它什么时候发布路由消息的,但是研究人员发现不同路由器它们发送路由消息,最终会达到同步化现象,也就是大家要不同时发布路由消息,要不不发布,这显然对网络的拥塞,这都是不利的行为。前面谈到同步化的行为,科学家就想到这些不同类型的复杂网络为什么会产生这些同步化的现象,就是在不同类型的同步化现象背后共同的特征是什么?特别是近几年人们也把同步化现象产生与复杂网络突破结构结合起来,在这方面通过研究,我们就发现如果一个复杂网络当中,任何两个结点之间,都是直接相连的话,那么只要这个网络的规模足够大的话,这个网络之间的结点必然会产生同步化现象。而对于一个只有局部相连的规则网络而言,对这个网络而言,不管两个结点之间的连接强度有多大,只要网络规模足够大的话,这样的网络是不可能达到同步的。而我们关于小世界网络的研究,我们发现只要在原来局部规则网络的基础上,引入少量的几个长城链接,就能够显著改善网络同步化的能力。对五次度网络同步化的实验表明,由于网络的非均匀特性,就是少量结点在五次度网络的作用,相当于几个结点起作用,这样使得五次度网络与新型网络类似同步化的能力也是非常强的,所以说这就在一定程度上解释了为什么许多复杂网络它都具有一种同步化的趋势。

前面谈到了网络的鲁棒性、脆弱性以及网络的同步化现象与网络突破结构关系。最后想简单以问题的形式提一下复杂网络上面的传播现象。什么叫做复杂网络传播现象?也就是最初一个局部的小的故障,小的扰动是怎么在网络当中传播的,怎么样最终影响整个网络系统行为的?这方面的例子也是很多的。比如说,由于狂风暴雨,使得某一个地方的电线杆倒了,这就有可能在很短时间内导致一片城区都断电,这就是电力网中的连锁故障。以我们的经济活动为例,最简单的例子就是亚洲金融危机,在1997年亚洲金融危机发生之前,那些发生危机的国家它们的经济建立了长达十几年的经济增长,所以普遍抱有乐观的态度,以泰国改变汇率制度为导火索,在短短数周内,就影响了韩国、东南亚、香港等等,引起了亚洲金融危机,这个危机固然于经济的网络化不断加深有关,另外一方面也与我们对这样一种局部性的事件,在这样一种经济复杂网络当中所能够造成的这样大的传播估计不足,准备不足有关系。另外一种传播现象的例子,就是我们病毒的传播,像艾滋病、SARS这样的病毒,最初只有一两个人,少数几个人得,为什么会逐渐在我们人类当中传播开来,这样病毒在我们人类之间传播,与我们人类之间的连接到底存在什么关系?我们经常见到各种各样的计算机的病毒,这些计算机病毒到底又怎么样在互联网上传播的?应该来说,在过去很多年间,科学家们在对传染病传播机理研究方面,应该说取得了不少的进展,也建立了不少传染病的模型,但是我想今后如果我们在研究这些病毒,不管是在人类网络当中传播也好,还是在互联网上传播也好,我们在研究这些传播机理的时候,如果能够考虑到复杂网络在结构上的一些特征的话,也许能够使得我们有更好的预防和控制这些病毒传播的方法。我在去年看到一篇没有发表的文章,就谈到如果我们人类网络确实是具有这种五次度的特征的话,那么在艾滋病疫苗没有出现之前,也许预防艾滋病较好的办法,就是把那些少量的重要结点,就是对传播具有重要结点的人隔离起来,也许是较好的办法。对这次SARS我们采取隔离的办法,也是因为这一点。隔离确实是较好的办法。

小结今天和大家交流的问题,就是复杂网络是比比皆是的,如果我们有网络的眼睛,绝大多数都是复杂网络,而众多不同类型的网络背后确实是存在着某种共性的结构上的特征的,网络结构上的特征确实与网络的性能密切相关。总的看来,应该说在二十一世纪,我们整个科技所研究的对象变得越来越复杂,所以对复杂性的研究,对科学家来说既是一个挑战,同时也是一个机遇。大家都知道有一个著名的物理学家霍金曾在几年前说过这样一句话,他认为二十一世纪将是复杂性的世纪,我的报告就到这,谢谢大家的收看收听。

管延放

非常感谢汪教授给我们带来非常精采的报告,各位同学、各位老师,这里是上海交通大学抗击非典在线谈活动第44场,我们今天的演讲嘉宾是来自上海交通大学电子信息与电气工程学院汪小帆教授,他演讲主题是网络研究的主要进展,现在我们看到在网上有相当多的提问,有很多老师和同学都在关注我们这次讲座,下面我们就进入提问和回答的阶段。

首先网上有这样一个问题,我本人非常感兴趣,就是说你刚才在演讲当中提到复杂的网络,它经常会有一些同步现象,而这些同步现象,它可能对整个系统造成非常大的危害,那么我们能不能采取一些比较有利的措施去组织这种同步的发生呢?

汪小帆

这确实是一个很重要的问题,网络当中的同步化现象,在很多场合是有利的,像同步在通信当中就起很重要的作用,但是确实在有些场合,应该来说也是有害的。比如说我刚才在报告当中已经提到的互联网中的路由器,它们发生周期性的路由消息,就会发生这种同步化的现象,这种同步化的现象,就是网络研究人员所希望能够避免的。至于说到怎么样找到避免网络上同步化的现象,这个方法目前也是我们所希望重点研究的课题之一。在互联网上,目前避免路由器同步所采用的方法,就是网络专家在九十年代提出的,在每个路由器当中假如随机性的因素,这就是互联网当中路由器引入随机早期检测的机制,引入这样一个随机性的因素之后,实际上现在看起来并不能完全避免互联网上有害的同步化现象,我们往往发现一种同步化现象避免,另外一种同步化现象又产生了,所以怎么样针对复杂网络在同步有害的时候,能够有效的避免它,到目前为止还是值得进一步研究的课题,这也是我们关注的一个课题。

管延放

刚才还提到对人与人之间的距离进行评估,还有网络结点之渐进性评估,你提到人与人之间的距离是6,而网络之间结点距离是19,你能介绍一下它们为什么会有这样大的差别?

汪小帆

关于这个问题可以这样理解。就是关于网络小世界的特征揭示,我想重要并不是看到这个网络结点平均距离是6,那个网络结点平均距离是19,而另外一个网络结点平均距离是2,我想重要的不是2、6、19这些数字之间的差别,而重要的我想应该是在不同类型的实际网络,它们所表现出来的一种惊人的相似的特性。事实上,你想想看,不管是人类网络还是万维网也好,网络当中的数量是以十亿来计,对于大型的复杂网络而言,两个结点之间的平均距离是6也好,是19也好,哪怕是50也好,这种差别可以忽略不计,因为网络当中的结点一个十亿,一个是50,这样的差别我认为可以忽略不计,重要的是看到不同的网络之间共同小世界的特性。

管延放

是不是可以这样看,就是我们研究网络更多是抽象的特性,而不是具体数字上的区别,对我们的研究是更有作用的,是不是这样的?

汪小帆

我想科学很重要的观点,或者是上升到理论高度,就是不同事物之间存在着什么样的共性,通过对共性的理解,我们再反过去用到不同的系统上面,针对某个具体的系统,看能有什么指导性的作用。

管延放

研究也就是这样进行下来了。

汪小帆

对。

管延放

网上还有一个问题,就是你提到Internet非常容易受到攻击,但是通过网络的手段可以适当保护Internet,您能否介绍一下怎么利用网络的手段来保护Internet?

汪小帆

关于这个问题,我想Internet互联网应该说是我们研究复杂系统或者是复杂网络的一个非常典型的例子,因为我们的生活可以说每天都离不开互联网,当然我们普通用户在使用互联网的时候,我们也许没有关系,我们不关心我发一个E—mail给对方,不会关心这个网络有多复杂,但是作为科研人员来说,我们对这一点应该是很关心的。那么Internet它的一个难点在什么地方?Internet发展到今天是没有一个统一的全球行政管理机构,像航空网有航空管理机构,Internet网没有管理机构,每一个ISP公司它是自己决定他的路由器跟外界怎么相连,这是他自己的事情,所以每一个公司都自己做出连接决定,而且实际上每个公司他的连接的结构都是机密,往往在那工作都不知道。但是这种分散决策和管理庞大的Internet,可以说某种必然的方式产生少量的结点,就是大量的路由器都挂在少量的结点上面,这样对Internet的通常应该起着很关键的作用,因此说维护这些少量的大结点稳定的工作,对我们整个Internet每天保证它正常工作,是起着至关重要的作用,这也就是为什么我们每天互联网上都有路由器发生局部的故障,而我们普通的公众都可以很正常的使用互联网的因素。但是反过来,这些少量大的结点存在,也使得我们要想使互联网变得瘫痪,我们找到最主要的方法就是使得这些少量的大结点瘫痪。比如说我把我们国家出口的那几个结点使它瘫痪掉,不能工作,那么我们整个中国的用户都要受到影响。这样就会带来一个问题,如果我们知道这一点,为什么黑客不把少量的大结点攻击掉就可以使整个互联网瘫痪,为什么他们不这样做?当然我没有对黑客的心理做过调查研究,但是我想最重要的有一个因素,就是实际上我们Internet也是黑客他赖以生存的平台。

管延放

没有Internet,黑客也无从谈起。

汪小帆

没有Internet,黑客也没有存在的必要。

管延放

是寻找问题,并不是使它们瘫痪。

汪小帆

或者是对某个局部的站点进行攻击,所以一般的黑客也不希望整个的互联网陷入瘫痪。但是有一点值得注意,就是随着我们整个人类对互联网,不管是经济活动还是生活,对互联网的依赖性越来越多。随着网络在经济生活、政治生活、日常生活起的作用越来越大,有一个潜在的危险,我想是有可能存在的,这不是黑客,而是恐怖主义,我想今后恐怖主义也许会在某一天会把对Internet的攻击做为主要的攻击手段,而不是用飞机撞世贸大厦之类的,这倒是一个潜在的威胁。

管延放

是不是我们也能够引用一下网络理论对恐怖主义做一些防治?

汪小帆

应该说有这种可能性,但是目前来说我还不敢肯定能行,但是至少有这样一种可能性。就是说如果我们把这些恐怖主义者看做是一个复杂网络,那么我想我们要使这个恐怖主义网络陷入瘫痪,我们有效的方法首先想到的就是像拉登这样的头面人物抓住,但是也许紧紧抓住一个拉登,可能使这整个恐怖主义者网络瓦解还是不够的。前面我曾提到过网络中连锁性的故障,这本身来说,像病毒在我们人类网络当中连锁性的传播,这本身是一个不好的方面,但是我们也可以用连锁性故障的想法,也许从内部使得恐怖主义网络土崩瓦解,就是我们通过打掉少量的关键性,使它内部产生连锁性的故障,在内部土崩瓦解,这也许是一种方法。

管延放

就是你说小规模的毁坏,可能到底大面积的崩溃。

汪小帆

对。

管延放

整个经济在不断的全球化,所以各个地区的经济发展可以说互联性非常高,就是一叶落下便知秋,是不是网络理论在经济危机当中也能起到一定的作用?

汪小帆

这个问题我想至少在近期里面,要想把复杂网络的理论直接用预防经济危机不太可能,最主要的难点在什么地方?因为确实经济全球化网络不断加深,但是至少在近期而言,我想我们知道它是一个网络,但是还想不出什么方法把网络地图画出来。

管延放

就是只知道它是一个网络,但是对我们来说是一个黑箱。

汪小帆

对,因为你想把所有的国家与国家之间,公司与公司之间,人与之间的关系画出来,我们不知道是怎么样的。

管延放

性质本身就决定是复杂的网络。

汪小帆

互联网是非人的复杂网络,路由器就放在那,有可能得到比较较精确的。而像经济关系,很多情况下是一种软性的关系,到底这个地方存不存在关系,那个地方存不存在连接,往往很难来较精确刻划的,难点就是无法画出这样的地图,既然无法得到这样一个地图,我们就不知道哪一点是脆弱的一点,如果这一点发生故障,它是怎么在这个网络上传播,我们很难做科学研究。

管延放

就是复杂网络更多是数学模型,如果数学模型建立得好的话,在复杂网络里面就应用得好?

汪小帆

这只是一个方面,至少我们要有实际的统计数据,就是至少我们要知道我们能够测量到网络当中结点是怎么样相连接的,至少我们要知道这样连接的特性,然后才能进一步做。如果我们连数据本身都没有的话,科学是不能在这凭空想象的,我们至少要有数据。

管延放

现在网上还有这样一个问题,他说复杂网络研究的成果,他在生物学当中有一些什么样的应用,您刚才也提到过在生物学当中的应用。

汪小帆

对,我想大家都知道人类基因图谱的绘制,已经宣告完成了,这应该来说是一个了不起的成就,对我们整个人类来说都是了不起的成就,但是也许这一划时代的工作所带给我们很重要的启示,事实上我们即使到现在,我们对细胞究竟怎么样工作,仍然不清楚,怎么样大量的分子相互连接,相互作用就产生生命,我们仍然缺乏很深入的了解,因此我想在今后相当长一段时间里面,各种各样对生物网络的研究,在生物学当中,会起到越来越重要的作用,像生物学当中有一个新的学科,叫做生物信息学。那么生物信息学它很重要的目的、任务,就是想从实验当中得到大量关于生物分子与分子之间相互作用蛋白质的数据当中,得到一些有用的数据,从海量的数据当中得到有用的数据,所以我想如果复杂网络这样的观点,从网络观点研究复杂系统,如果要找一门学科说它起着很重要的作用,我想网络的观点在生物学起的作用会越来越重要,而且现在生物学已经朝着这个方面转变。

管延放

我记得几年前我看过一本书,生命细胞的作用,他提到很多很简单的生物,它们本身做不了事,但是组成一个群体,就会表现非常复杂的行为,比如说蚂蚁走来走去没有方向性,但是两个蚂蚁一接触触角,就可以觅食、避免攻击等等,就相当于网络已经发挥作用了,这可能就是网络理论在生物群体当中可能起的作用。

汪小帆

你刚才提到的观点是很好的,确实是这样的。就是我们现在对复杂系统、复杂网络的研究,我们所关注的一个很重要的现象,就是单个个体的行为往往都很简单,那么为什么这些非常简单的单个个体通过相互的作用,相互的影响,就会产生出一种与个体完全不同的行为,这是近几年来复杂网络科学研究,就是为什么会出现这种现象,就是所谓的庸闲的理论。为什么大量的神经源连接在一起就产生行为,这就是网络行为对单个个体不一样的地方,这就是复杂网络需要解决的问题。

管延放

现在问题越来越多,大家越来越关心这个问题。有一位同学说博弈理论在复杂网络里面的作用如何,博弈很难在工程理论上应用,你怎么看待这个问题?

汪小帆

对这个问题实事求是讲我没有研究博弈理论在复杂网络里面的应用,但是博弈论作为一种学科方法,我知道它在某些复杂系统研究方面有过研究,但是我没有做过博弈论,所以我不知道在复杂网络当中能够起多大的作用,这一点我不敢肯定,但是作为一种理论总有存在的必要。

管延放

所以也有人在做这方面的工作。现在还有一个问题,就是现在网络拥塞的理论是引用控制理论的研究,对他们学控制的来说也是一个机遇,你能不能谈一谈这种研究的现状,以及对学控制理论的来说,比如说网络它的一些研究的可能方向?

汪小帆

一般的复杂网络现在变得比较专业一点,进入到互联网的拥塞控制,我不是这方面的专家,但是互联网的拥塞控制,我想学控制与控制理论研究的人来讲还是有所启示的,那么互联网上这种现有的拥塞控制的机制,事实上并不是由搞控制的学家们提出来的,而是由网络专家提出来的,是由网络专家在1988年提出来的,那么他们根本就不懂我们现代很高深的控制理论,近些年有越来越多搞控制的研究人员,快事关注像互联网这样一种复杂系统的控制问题,那么实际上对Internet而言,不但引入拥塞控制,还有无线网络的控制等等许多控制问题值得研究,所以我想我们做控制研究人员在这方面应该有所作为,但是研究这方面的时候,我想我们一定要跟Internet网络本身它的背景结合起来,像二十世纪八十年代提出来的拥塞控制,为什么十几年、二十几年,一直用到现在,为什么网络专家不懂控制的人也能提出这么有效的控制方案,所以在设计控制方案工程上的直觉也是很重要的,所以我们搞控制理论的千万不能把它抽象成一个数学模型,就不考虑网络本身,我们一定要想到这个模型背后的网络,就是最终我的控制方案有效不有效,是要以这个网络作为检验的标准。

管延放

以最后的实际情况。

汪小帆

不是以数学模型作为最终控制,所以Internet网络对控制研究人员有很多研究的课题,但是对控制研究人员而言,我们应该更多看到我们的特性。

管延放

汪老师,通过刚才您的介绍,我发现复杂网络控制,它是一个非常广的一个领域,它的跨学科性非常强,你是否给我们简单介绍一下,我们网络理论究竟牵扯到哪些领域的学习,还有对哪些领域的应用起着非常重要的作用?

汪小帆

确实是的,应该说复杂网络是一种跨学科的研究。如果要从基本的理论性的研究来讲,它可以说是数学和物理学,特别像统计类学,从理论的角度来讲需要这些,但是从实际的角度来讲就要看你是哪个学科,几乎所有的学科都可以找到你这个学科复杂网络的例子。至于说复杂网络的研究,到底能够对哪些学科产生影响,目前来讲不能给完全的定量,但是至少在复杂网络的思想可能跟私募学目前研究的思想是比较吻合的。另外现在复杂网络一个典型的例子就是Internet,也许我们关于Internet,还有万维网所做的一些研究,可能会有助于设计更好的Internet上面的一些应用。比如说万维网小部件的研究,也许会做做更好的搜索引擎,我们现在的搜索引擎并不是很好,那么我们能不能找到更好的特性,或者我们能不能找到一种方法假如少量的模型进去,使得互联网的世界更加小,从而使得我们搜索更加容易,这都是我们研究的课题。

管延放

汪老师,现在有一位同学对你比较了解,他提出你擅长混沌控制与同步的领域,你在擅长的领域对复杂网络的研究,有哪些设想?

汪小帆

这个同学应该是看过我的主页。在2000年我一直是混沌控制与同步为主要的领域,我进入复杂网络研究领域,也是在看到98、99年发表的一些文章开始着手的,我开始着手基于我自己研究的背景,我是把混沌研究方面的知识和复杂网络的知识结合起来,我研究的一个重点就是复杂网络同步化的现象,我刚才提出复杂网络同步与结构的关系可能是这几年的研究成果,就是假设每个结点都有混沌动力行为,如果具有小世界特征、五次度特征,它的同步化特征到底有多强,这是我这几年研究的主要工作。这个同学至少是看过我的主页。

管延放

有些系统里面,小部分的变化可能变成大系统的崩溃,就像混沌理论的蝴蝶效应,这方面都有共通的地方,所以说汪老师在这里也确实找到了你所擅长的地方。

汪小帆

对。

管延放

网上有些同学对你提出复杂网络理论非常感兴趣,他们想问您,就是您能不能提供一些入门材料,或者是读物,让大家更多了解一下复杂网络的进展?

汪小帆

当然没问题,我可以把这方面几篇我认为比较好的综述性的文章放在我的主页上面,大家感兴趣的话,可以过几天访问我的个人主页。

管延放

汪小帆教授的主页我也看过,大家只要在交大主页的搜索框里面打汪小帆,直接就可以找到他的主页,就可以看到资料。

汪小帆

或者到交大自动化系在博导资料里面找到,也有我个人的链接。

管延放

我现在有这样的问题,就是在抗击非典在线谈的活动已经进行了43场了,在一系列的活动中,也有幸请到很多比较知名的学者,包括您在内的学者,我想问一个问题,就是你作为一个学者,你最看重的素质是什么,就是怎么样才能成为您这样优秀的学者?

汪小帆

我的学生一入学,我跟他们都说做人是第一位的,做学问是第二位的,尽管有点老调重弹。而且我主要问他们,你为什么要做学问,就是你为什么要读研究生,我觉得如果你真觉得做学问是枯燥无味的,你是很难做学问的。我们搞研究的人认为做科学研究本身,我们的最终目的,是为了使我们的人类生活更加美好,也使我们自己的生活更美好,我想这是我们做研究最重要的目的,这不是讲大道理,我想有了这样的目的以后,做研究的时候应该有这样的激情,就是每天当你起来的时候,就觉得我对我的研究目标充满了激情,这样我觉得才能做好研究,所以我觉得第一位首先要做一个很好的人,这是最重要的,做人是一辈子。

管延放

有很多大师提到自己研究生涯的时候,他们首先说你要爱一件事才会走进去,否则就在外围徘徊。

汪小帆

对,如果你没有激情的话,很难做第一流的事情出来。

管延放

网上有一个很专业的问题,复杂网络研究的成果,怎么样用于网络鲁棒和安全?

汪小帆

这个问题我没有做过研究,但是对提的问题本身我觉得倒确实是一个很重要的课题。直观来讲,如果这个网络是五次度的网络的话,也许是不是我们要使这个网络的安全性更好的话,我们要把主要的心思放在少量大的结点上面,但是我想这是一个很重要的课题,确实值得研究。

管延放

汪老师,因为网络这个概念它本身是有非常悠久历史的东西,但是我们真正开始从理论的角度来研究复杂网络现象,您能不能给我们大致介绍一下复杂网络研究它的历史,就是这个学科走过怎么样的一个过程?

汪小帆

首先到底什么是网络?我觉得所有的东西都是网络,甚至我们人身上的一个细胞本身就是一个复杂网络,分子是大量原子构成,原子还可以再细分,所以说几乎所有的东西都可以看做是网络,至于对复杂网络的研究,真正从科学上开始对复杂网络做理论上的研究,如果我们正规得算,应该可以说是从二十世纪六十年代开始,由数学家阿尔多斯提出随机图理论,就是他们用完全随机的理论描述具有复杂结构,从二十世纪六十年代开始,一直到将近40年的时间,到1998年之前,这种完全随机的结构始终是我们研究复杂网络的原形,但是随着我们对大量实际网络数据的研究,通过我们在1998年对复杂网络的小世界特征的发现和1999年对复杂网络的五次度特征的发现,可以说在最近几年里面,应该来说掀起了一个研究复杂网络的高潮,而且研究复杂网络的研究人员他所研究的领域包括理工科、人文科学等不同领域,现在几乎每个月都有许多关于复杂网络的理论应用的文章大量的在网上出现。

管延放

我们知道十九世纪至二十世纪有三大理论,信息论、控制论、系统论,你所介绍的复杂网络与这三大论有千丝万缕的联系,你能否介绍一下它们之间的联系?

汪小帆

我很难恰当地谈它们之间的关系,但是我总觉得在二十一世纪网络的观点也许会成为我们不同领域里面研究复杂系统的一种基本的观点之一,我只能这样说,就是网络的观点会成为我们研究复杂系统的一个基本观点。我们人类在二十世纪科学研究采用的基本手段,就是把一个复杂手段拆散,我们研究各个简单的单元,我们企图通过研究一些基本的单元的功能来了解整个系统的功能,那么现在我们有必要看这些基本的单元是怎么样通过相互连接,相互作用,组成一个整体的,我们继续要研究各个基本组成单元的功能,同时我们也需要对它们之间到底是怎么样相互作用的,在这方面我们可能要花更多的精力,所以总的观点我认为研究复杂系统的一种基本的观点之一。

管延放

网络之间怎么影响也是网络之间的一种实例,这样对我们整体的学科研究,有点像是科学学这样一个学科。

汪小帆

你这确实是一个很好的例子,事实上我们科学发展到今天,任何一个学科完全孤立地发展,可能都未见得能行得通,学科与学科之间的交叉越来越强,如果我们把学科看成一个结点,学科与学科之间的关联程度现在确实变得越来越强,而这种交叉度,对每个学科之间的发展确实有很大的好处。

管延放

就是不仅要从自己的实践行为当中要实现网络化的方向,还要拔高一个层次,从网络看怎么作用的,网络化的意义也非常广大。

汪小帆

还有提到科学联系分析,所以我想现在我们做学问,比如说我做控制,只懂控制,其他一点不懂可能也不行的,就是我们每个做研究的人员,也要尽可能关注其他学科的一些进展,也许我们会从其他的学科时不时吸取到一些营养。

管延放

我记得六十年代采访丁教授的时候,别人问他为什么能有这么多的发现,他就说我经常看各个领域的学科,用他们的思路反思我自己做的事,往往会有新的发现,这是不是网络上面的一种影响?

汪小帆

确实是这样,这应该说对科学研究是很重要的。

管延放

而且到一定程度,可能觉得各种学科之间,它们确实有各种各样的联系,因为思维方式都有相近之处。

汪小帆

对,我们人类社会进入文化社会,我们以互联网飞速发展是做为主要标志,但是事实上不仅是互联网,交通网、电力网,我们人类之间的交流,学科之间的交叉也好,可以说几乎所有的东西都在趋于网络化,这是整个共同的特征,所以网络化可能是无法避免的。

管延放

所以现在有很多的社会学家用数学方法、信息论、网络的方法研究社会,这些研究交叉性都是非常强的。

汪小帆

对。

管延放

接下来汪老师对在屏幕前的观众、同学、老师,你觉得非常愿意跟大家分享的,在工作当中的感受您能不能简要谈一下?

汪小帆

我也是非常高兴能够有这样的机会跟大家做学术交流,尽管我们没有面对面的交流,但是实际上我觉得这样一种交流也是非常好的。我从我本身对复杂网络、混沌论的研究,我较大的感受就是我确实热爱这样的研究,就是我确实从这样的研究当中感受到了乐趣,我想这是最重要的,这是我得到的从事科学研究一个最主要的体会。有了乐趣你才会有时候废寝忘食。

管延放

而且确实在废寝忘食当中,研究得到不少成果,这也是对您努力较大的回报。今天的网上学术报告到这里我们就结束了,非常感谢今天到会的所有的老师、同学,也包括所有即将通过网上点播我们节目的老师、同学和校内外朋友,尤其感谢我们交通大学电子信息与电气工程学院汪小帆教授。最后祝大家身体健康、工作顺利,谢谢大家。


展开阅读全文

没有更多推荐了,返回首页