随机网络的扩张

最新推荐文章于 2021-11-08 03:10:31 发布

sevenseablue

最新推荐文章于 2021-11-08 03:10:31 发布

阅读量1.7k

点赞数

分类专栏： book 文章标签：计算机朋友网

book 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

随机网络的扩张

概要：

象遗传网络或者www网络一样多样化的系统被贴切的描述为复杂拓扑结果的网络。许多大的网络的一个共同特性是点的连接时一个无上限、幂规律的分布。这个特性被认为是两个通用机制的结果：1）网络通过不断的添加节点来扩展，2）新节点更多的被添加在已经有很多连接的点上。（马太福音）。一个以上面两点建立的模型再生了观察的比较完全的无尺度分布，表明了大型网络的发展是被超越了个体系统细节的机器自组织现象所决定的。

当代的科学描述由不完全相同的、有多样性和非本地连接的元素构成的系统的无能为力限制了许多学科的发展，从分子生物学到计算科学。描述这些系统的困难部分在于他们的拓扑：许多系统产生了复杂网络（点是元素，边是点与点的连接）。举个例子，遗传系统形成了一个巨大的基因网络，点是蛋白质和基因，他们之间的化学反应是边。在不同水平的组织，一个大型网络通过神经系统来形成，电视神经原，轴突连着他们。但是对等的，在社会科学中也出现复杂网络，点是个体或者组织，边是社会关系，在www，点是html为文档，用link来详解。由于这些网络太大，连接的复杂性，这些网络的拓扑大部分还不清楚。

传统意义上讲，复杂拓扑网络已经通过 Erdo˝s and Re´nyi (ER)模型理论描述过了，但是由于大型网络数据的缺失，ER理论的预测性在现实世界还没有被测试过。随着数据获得方式的电脑化，这样的拓扑信息成为可能，提高了我们理解大型网络的动态和拓扑稳定性的可能性。

这里我们报告一个有高度数的自组织网络的存在，这个自组织网络以大规模的复杂的。研究了描述几个大型网络的数据库，从www到科学中的引用模式，我们发现，系统的独立性和元素的标识性，概率P(k)，即网络中一个点拥有k连接点的概率，呈现幂函数递减，P(k) ~ k**-m。这个结果表明大型网络自组之成为一个无尺度的状态，一个现有随机网络模型无法预测的特征。为了找到这个scale不变量的源头，我们证明了现有的网络模型无法体现成长性和优先选取性，真实网络的两个主要特征。用一个能体现这两个特征的模型，我们证明了他们符合显示网络中的幂函数递减规律。最终，我们认为这些元素在许多复杂系统的信息中占据了一个易于识别的重要的角色，这个表明了我们的结果与自然中的一大类的网络是相关的

尽管有许多系统能产生复杂网络，没有多少能了解详细的拓扑数据。电影演员的共同出现图展现了一个社会网络的证据充分的例子。每个演员都是一个节点，当两个演员同时出现在一个电影中，那么连点之间有一连线。一个演员有k个连接的概率有一个幂函数的长尾巴，即大大的k，满足P(k) ~ k ** -m，m是2.3土0.1（图1，A）。一个更复杂的网络，有800百万个节点，即www网络，一个节点时一个文档，一个边表明两个文档由链接从一个指向两一个。这个图形的拓扑表现了web的连接型，并且表明了在www寻找信息的有效性。P(k)可以通过机器人得到，表明有k个文档指向一个指定网页也遵循幂函数递减，m（www）=2.1土0.1（图1，b）。有个网络是西部美国电力网络的，他的拓扑展现了城市与工业化的历史模式，节点时发电器、传输器、变压器，便是高压电线。网络的相对较小，只有4941个节点，区域大小也不突出，但是非常贴切的描述了一个幂函数规则，m（power）=4（图1，c）。最后，一个非常大的复杂网络，由科技论文引用形成的，借点是论文，与论文中引用的论文相连。最近Redner(11)证明了一个论文被引用k次的概率符合幂函数递减规律，m（cite）=3。

上面的例子说明规律许多大的随机网络都有一些共同的特征，他们的连接型式没有尺度的，服从一个幂函数（对大的k），指数从2.1到4，在现存的网络模型中是没有预测到的。ER（7）的随机图模型假设，从N个节点开始，概率p连接任何一对节点。在模型中，一个节点拥有k个边的概率服从泊松分布P（k）=e**-入入**k/k！，入=N{N-1:k}p**k (1-批）**（N-1-k)，N*从N-1取k*p的k次方*1-p的N-1-k次方。在WS引入的小世界模型中，产生一个N节点的一维圈，每个节点练到他最近的两个邻居。在概率p下，每个边被重新连接到一个随机的节点上。这个过程产生的一些列连接减小了解点之间的距离，产生了一个小世界现象，一般被叫做六度分离。对于p=0，连接数的概率分布P(k)=狄拉克(k-z)，（http://en.wikipedia.org/wiki/Dirac_delta_function），z是圈初始分配的边的数量；对于限值p，P(k)仍然在z的附近取得最高点，但是它分布的更广了。ER和WS的共同特征是，找一个多连接点的概率随着指数k递减；有时候多连接点是确实的。相反，网络研究的幂函数尾巴特征P(k)表明了多连接的点有很大的机会出现并主导这个连接。

这些模型没有包含现实网络有两个通常的特征。一个是从固定的N个节点初始化，是随机连接的ER模型，或者是重新连接的WS模型，都没有修改N。相反，现实网络是开放的，并且他们持续不断的吸入新节点到系统，网络的生命周期里一直在增加N的值（这个是论文里的，不过有待商榷，他没有考虑网络的衰败和消失过程）。举个例子，电影网络一直在加入新人，www网页一直在添加新的网页，研究机构也一直在出论文。所以，一个特征就是一个网络一直在持续不断的吸入新的节点到系统。

第二，随机网络假定两个节点是否相连是随机的，即概率是一样的，并且是全局同意的。相反，大部分显示网络表现出优先连接。举个例子，一个新演员更多情况下是一个配角，和更多的已经有名的演员一起演戏。结果，一个新演员与有名的演员配戏的概率就大大的大雨没有名气的演员配戏的概率。相似的，一个新建立的网页一般都有链接到达网站的连接，一个新的手稿更有可能引用一个有名的、被多次引用的论文而不是那些不是多么有名的。这些例子表明一个节点连接到系统中的已经存在的节点的概率不是统一的；连接到一个有很多连接的点的概率是更大的。

接着说明一个基于这两点的模型产生已经被观察到的固定指数的分布。为了包含网络的成长特征，我们从一个有很小的m0个节点的网络开始，每一个我们家一个新节点，将这个节点和m（<=m0)个点连接。为了包含优选特征，我们假定一个新节点连接到节点i（i的连接数目为ki），P(ki)=ki/kj的和（j从1到点的总数）。 t步后，模型产生了t+m0个节点和mt个边。网络进化成一个固定指数的状态，一个点拥有k个边的概率服从一个幂函数分布，指数m(model)=2.9土1（图2A）。因为现实网络的幂函数在系统不同的阶段描述系统都是不一样大小，需要能提供一个与时间无关的分布的模型，在图2A里表明的，P(k)是独立于时间的（后来也与系统的大小m0+t无关），表明尽管有持续不断的成长，系统组织自己在一个幂函数分布的稳定状态。

模型的幂函数式的扩展发展表明了成长性和优先选取在网络发展中的重要性。为了证明两个都是必须的，我们研究模型的两个变量。模型A保持网络的成长型，但是通过加入新节点时加边的概率统一相等来将优先选取被去掉[P(k)=const=1/(m0+t-1)]。这样一个模型，（图2B），其中P(k)~exp(-beta k)，表明优先选取的缺失带来了分布的幂函数扩展特征的缺失。在模型B中，起始于N歌节点和0个边。在每一步中，我们随机选一个点，然后与节点i相连的概率为ki/kj的和（j为所有的边）。尽管在开始的几步中模型呈现一个幂函数扩展，但是p(k)是不稳定的：因为N是固定的，边的数量随着时间的改变，当T~~N**2后，所有的点都相连了。模型A和B的失败表明了成长型和优先选取是稳定幂函数分布的必备因素。

由于优先选取，一个节点比另一个节点拥有更多连接的话，他增加他的连接数的可能性就更高；所以两个点在初始化的不同会随着网络的增长变的更不同。一个已经存在节点在第t步得到新节点的连接的概率是 ki对t的偏导数=ki/t，ki(t)=m(t/ti)**0.5，ti是节点i在第i步添加到系统中，（图2c），网络连接型的时间分辨的数据有了后扩展性质才能测试。老节点（小ti）以年轻点的代价来增加他们自己的扩展性，随着时间到这了一些节点时高连接型的，一个‘富者更富’的现象出现在真实网络中。更多的，属性能被用来解析的计算幂函数的指数。一个节点i拥有小于等于k的连接性的概率，p[ki(t)<k]，可以写为P(ti>tm**2/k**2)。假定我们在等时间间隔里加点，我们得到P(ti > tm**2/k**2)=1-P(ti <= tm**2/k**2) = 1 - tm**2/k**2 (t+m0)。P(k)的概率密度可以通过偏导数得到，他随着时间产生一个稳定的式子P(k)=2m**2/k**3，其中幂函数的指数为3，独立于m。尽管他们产生了幂函数分布的，但是这个模型并没有我们学习模型的全部特征。我们需要对系统做更细节的建模。举个例子，在模型里，我们假定先行的优先选取，p（k）~k。然后，一般来说，p(k) ~ k**alpha，我们的模型仅仅是alpha=1。更多的，不同网络得到的幂函数的指数分散在（2.1，4）。然而，很容易修改模型得到一个指数不是3的。举个例子，我们假定连接是有方向的，我们得到幂函数的指数m为3-p，支持方向的模型。最后，一些网络不仅通过加入新节点来进化，有时候也通过在已存在的的点集合里加入新边或者删除边来进化。虽然这些和其他的系统特征能修改指数m，我们的模型给出了第一个成功的机制，用这个机制来得到一个指数不变化的自然的真实网络。

成长性和优先选择是很多复杂系统的机制，包括商业网络，社会网络，交通网络。xxxx。对这些系统的一个更好的描述可以帮助理解其他复杂系统，很少有拓扑信息，包括生物系统中遗传和信号网络的重要例子。我们认为生物系统不是开放的和成长的，因为他们的特征遗传编码的。然后遗传和信号网络的幂函数固定指数特征会反映了网络的进化历史，被成长性和不同成分的聚合主导，由简单模型到复杂机制。在解码基因网络的快速发展中，对这些问题的答案不会太远。相似的机制会解释社会和经济这些竞争系统中的节点之间的差距原因，因为无标度的不同体是自组织网络的必然结果，因为个体节点的决定基于的信息与那些富有节点的信息是不对称的，相对来说是偏失的，不论本身或者原始的能见到的信息的不同。