基于Petri网的P2P系统性能评价

  
引言
性能评价是计算机网络和计算机系统研究与应用的重要理论基础和支撑技术。本文试图从性能评价的角度对当前非常流行的P2P系统进行分析。本文由以下几个部分组成。1。性能评价的目的及介绍,2。 Petri网在计算机网路系统性能评价中的介绍,3。P2P系统的特点,4。在前面的基础上提出一个基于Petri网的P2P性能分析模型:多队列和多服务器的对等服务系统模型,5。 模型的求解方法和性能评价,6。 结论及工作展望,最后是参考文献列表。
1.           性能评价的目的及介绍
   对于复杂的计算机网络系统来说,系统的性能评价主要目的有三个:选择,改进和设计。也就是我们要在众多的方案中选择一个最适合需要的系统。也就是选择一个系统性能最好的系统,有较好性能价格比的系统。我这里所说的系统性能包括以下两个大的方面:一是系统的可靠性或称可用性。也就是计算机系统可以正常工作的时间,这个性能指标可以是能够持续工作的时间长度,比如平均无故障时间,也可以是在一段时间内系统可以正常工作时间所占的百分比。另一类指标是各种响应时间,即从系统得到输入到给出输出之间的时间。还有一类指标是各种资源的利用率,也就是在给定的时间区间中,各种部件被使用的时间与整个时间的比值。
在实际的系统性能评价和分析中,不同的系统对性能指标的描述有所不同,对于网路系统常用的性能评估目标:信道的传输速率,信道容量和信道的吞吐率,信道利用率,传输延迟,响应时间和负载能力。对于一个实际的系统,其性能取决于多种因素,最基本的因素在于系统的配置,包括系统所使用的各种软件,硬件的成分,数量,能力,系统结构,处理和调度的各种策略和系统负载。我们进行系统评价的主要任务就是研究系统配置,系统负载,性能指标之间的相互关系。本文将利用Petri网作为系统建模的和性能分析的工具来对P2P对等计算系统做一个性能分析和评价。
2.           Petri 网是计算机网路系统性能评价和建模的重要工具
  自1962年德国科学家C.A.Petri博士首次提出Petri网模型以来,Petri网模型已在网络协议、软件工程、人工智能、形式语义、操作系统、并行编译、数据管理等领域得到了广泛应用;它是对信息系统进行描述和建模的数学工具之一。主要特性包括:并行性(concurrency),不确定性(nondeterminacy),异步(asychronization)和对分布式系统的描述能力和分析能力。
随着现代通信的高速发展,通信网络规模越来越大,它所覆盖的范围越来越广,提供的服务种类也越来越多。为了保证通信网络安全、可靠地而又有效地运行,应对网络运行进行管理和控制,这就需要对网络的性能进行分析。网络性能分析在通信网络正常运行中起着重要作用。在网络规划阶段需要根据网络的成本和性能要求选择网络的结构和技术,通过性能分析排除网络中的瓶颈;在网络运行阶段网络性能的异常能通过性能分析得以发现。由于通信网络中的业务的并行性、异步性、分布性、并发性、随机性,一般的理论分析工具很难展开分析,而Petri网理论正是分析网络性能的有力工具。Petri网能较好地描述系统的结构,表示系统中的并行、同步、冲突及因果依赖等关系,并能以网图的形式简洁、直观地模拟事件系统,分析系统的动态性质,易于通过构造的模型来分析系统的性能并直接实现对系统的控制,可以建立状态方程,代数方程和其他数学方法来描述系统地行为,然后通过求解,并在实际地设计中考虑分析这些结果,可以使系统的性能最优。本文将充分结合Petri网的特点对P2P系统做性能分析。
3 .P2P系统的特点
   为了能够对P2P系统建立一个合理数学模型。我们首先需要充分了解P2P系统的特点。
3.1 什么是P2P
        P2P ,英文Peer-to-Peer的缩写,中译为对等互联或点对点技术。P2P让用户可以直接连接到其他用户的计算机,进行文件共享与交换,另外P2P在深度搜索、分布计算、协同工作等方面也大有用途。P2P不是一个新概念,互联网产生时一个本质的特征就是P2P,只不过由于带宽及电脑处理能力等的限制,使得我们的沟通中出现了很多的中间环节,如中间服务器、门户网站、第三方信息(交易)平台等,这样个人用户在互联网上变成了被动的参与者,我们被动地接受那些“中心”提供的过时、芜杂的信息。P2P计算(Peer-to-Peer Computing)是指不同系统之间通过直接交换,实现计算机资源和服务共享、进行信息处理的过程。典型的P2P系统包括Freenet、Napster、Gnutella等P2P文件共享系统以及 Groove、Magi等P2P协作系统。
   大多数人最初是从Napster的品牌中知道P2P网络的。在这种应用中,P2P网络概念用于共享文件。但是,P2P不仅仅是用于文件共享,它还包括建 立基于P2P形式的通讯网络、P2P计算或其它资源的共享等很多方面。P2P最根本的思想,同时也是它与C/S最显著的区别在于网络中的节点(peer) 既可以获取其它节点的资源或服务同时又是资源或服务的提供者,即兼具Client和Server的双重身份。一般P2P网络中每一个节点所拥有的权利和义 务都是对等的,包括通讯、服务和资源消费。P2P是这样一种分布式网络,其中的参与者共享他们所拥有的一部分硬件资源(处理能力、存储能力、 网络连接能力、打印机……),这些共享资源需要由网络提供服务和内容,能被其他peer直接访问而无需经过中间实体。在此网络中的参与者既是资源(服务和 内容)提供者,又是资源(服务和内容)获取者。可以将P2P分为纯(Pure)P2P和混合(Hybrid)P2P两种模式。纯P2P网络中不存在中心实体或服务器,从网络中移去任何一个单独的、任意的终端实体,都不会给网络中的服务带来大的损失。而混合P2P网络中则需要有中心实体来提供部分必要的网络服务,如保存元信息、提供索引或路由、提供安全检验等。本文中我们将不考虑一个节点是如何找到另一个节点并为其提供服务或从那儿回去服务,我们将这个过程抽象成一个任务调度和分配的函数f.具体的过程同查找过程中所使用的算法相关。
3 .2 P2P网络的特点
可以看出与其它网络模型相比,P2P具有以下特点:
  分散化(Decentralization)
  网络中的资源和服务分散在所有节点上,信息的传输和服务的实现都直接在节点之间进行,可以无需中间环节和服务器的介入,避免了可能的瓶颈。即使是在混合P2P中,虽然在查找资源、定位服务或安全检验等环节需要集中式服务器的参与,但主要的信息交换最终仍然在节点中间直接完成。这样就大大降低了对集中式服务器的资源和性能要求。分散化是P2P的基本特点,由此带来了其在可扩展性、健壮性等方面的优势。
  可扩展性
   在传统的C/S架构中,系统能够容纳的用户数量和提供服务的能力主要受服务器的资源限制。为支持互联网上的大量用户,需要在服务器端使用大量高性能的计算机,铺设大带宽的网络。为此机群、cluster等技术纷纷上阵。在此结构下,集中式服务器之间的同步、协同等处理产生了大量的开销,限制了系统规模的扩展。而在P2P网络中,随着用户的加入,不仅服务的需求增加了,系统整体的资源和服务能力也在同步地扩充,始终能较容易地满足用户的需要。即使在诸如Napster等混合型架构中,由于大部分处理直接在节点之间进行,大大减少了对服务器的依赖,因而能够方便地扩展到数百万个以上的用户。而对于纯P2P来说,整个体系是全分布的,不存在瓶颈。理论上其可扩展性几乎可以认为是无限的。P2P可扩展性好这一优点已经在一些得到应用的实例中得以证明,如Napster,Gnutella,Freenet等。
健壮性
  在互联网上随时可能出现异常情况,网络中断、网络拥塞、节点失效等各种异常事件都会给系统的稳定性和服务持续性带来影响。在传统的集中式服务模式中,集中式服务器成为整个系统的要害所在,一旦发生异常就会影响到所有用户的使用。而P2P架构则天生具有耐攻击、高容错的优点。由于服务是分散在各个节点之间进行的,部分节点或网络遭到破坏对其它部分的影响很小。而且P2P模型一般 在部分节点失效时能够自动调整整体拓扑,保持其它节点的连通性。事实上,P2P网络通常都是以自组织的方式建立起来的,并允许节点自由地加入和离开。一些 P2P模型还能够根据网络带宽、节点数、负载等变化不断地做自适应式的调整。
隐私性
   目前的 Internet通用协议不支持隐藏通信端地址的功能。攻击者可以监控用户的流量特征,获得IP地址。在P2P网络中,由于信息的传输分散在各节点之间进行而无需经过某个集中环节,用户的隐私信息被窃听和泄漏的可能性大大缩小。在P2P中,所有参与者都可以提供中继转发的功能,因而大大提高了匿名通讯的灵活性和可靠性,能够为用户提供更好的隐私保护。
高性能
  性能优势是P2P被广泛关注的一个重要原因。随着硬件技术的发展,个人计算机的计算和存储能力以及网络带宽等性能依照摩尔定理高速增长。而在目前的互联网上,这些普通用户拥有的节点只是以客户机的方式连接到网络中,仅仅作为信息和服务的消费者,游离于互联网的边缘。对于这些边际节点的能力来说,存在极大的浪费。采用P2P架构可以有效地利用互联网中散布的大量普通节点,将计算任务或存储资料分布到所有节点上。利用其中闲置的计算能力或存储空间,达到高性能计算和海量存储的目的。这与当前高性能计算机中普遍采用的分布式计算的思想是一致的。但通过利用网络中的大量空闲资源,可以用更低的成本提供更高的计算和存储 能力。
3 .3 P2P网络与小世界现象
  统计发现,动态更新的P2P网络拓 扑结构在一定程度上满足某种规律。如果把握好这种规律,则对P2P网络的健壮性、快速查询及可扩展性都将有非常大的帮助。这种规律近年来在生物学、社会 学、生态学等领域也同时存在。很多科学家将这种规律称之为“小世界现象”(SMALL WORLD)[4]。
  目前,可把复杂的网络分成两类,其依据是网络的连通性分布P(k)。P(k)是指网络中一个节点与其他k个节点连通的概率。第一类称为指数网络 (exponential networks),是指P(k)成指数分布,比喻上面提到的small world模型。这类网络节点的连接度比较均匀,即基本上每个节点的联结数都近似相等。在这种网络内,网络的分离度(degree of separation)都很小,即任意两个节点之间建立连接的长度都很小;第二类称为可扩展网络(scale-free networks),是指P(k)呈幂数分布(power law)。很多网络,如WWW,Internet,Gnutella等都属于这一类。这类网络中大多数节点的连接度都不高,少数节点的连接度很高。可以将这些少数节点看成中心节点。这类网络连通性和可扩展性很好,而且非常健壮和可靠,即使有部分节点失效,也不会对整个网络造成过大的影响。但是,它的抗攻击性并不好。攻击者只需对连接度很高的少数节点攻击,就能造成网络的瘫痪。小世界现象的另外一个规律是,网络结构与系统性质来自于自组织、成长与竞争。在本文中我们假设这样的小世界最终为收敛到一个稳定的状态,我们可以求出系统的稳定状态分布。
   分离度与幂数分布对P2P网络拓扑结构的构建与发现、动态更新、资源定位(Content Routing)等都有很好的利用价值。P2P形式的网络也开始叫做对等网络。
3 4 对等网络
对等网络,是基于P2P技术的网络构架形式,旨在建立对等的计算机网络,以更加高效的方式来提供网络里的信息和服务。标准的实现技术是P2P技术,基本的思想是对等传输。对等网络不是要取代传统的网络形式,而是力图在传统网络的基础上架设新的组织方式,通常会和原有的网络合作来提供服务。
目前,统一的规范和国际化的标准还没有出现,更加好的技术也在讨论之中,因此未来的对等网络是怎样的,尚是未知数。以下的几点,是我对建设对等网络模型中需要遵守的基本规范的思考,正是基于这几点思考,才为试图为其建立一个合适的数学模型来描述和分析。
首先,P2P代表了新的互联网的计算方式。在P2P的模式下面,网络所有的计算任务不应该交给一台或者少数的服务器来完成,服务器该完成的应该是保证网络的通畅运行和路由规划,而大量的信息提供和服务提供,应该由网络中的节点计算机来完成。每一台联入网络中的计算机都需要具备与外界交流信息、向外界提供基本网络服务的系统软件。
其次,P2P需要解决的问题首要即是信息的路由和检索。这关系到P2P网络是否易于使用和系统整体性能的重大问题。
最后,P2P网络应该存在自我完善机制。最终达到自动计算8法则(类生物),知道自我,构成自我,优化自我,治愈自我,保护自我,生长自我,知道邻居,帮助用户这样的目标。

目前基于P2P技术的对等网络计算流量已经占据了互联网的大部分带宽,迫切需要对P2P系统进行性能分析和评价,以帮助和指导P2P系统的设计和选择,同时为网路管理机构提供参考。

 

 P2P系统与现在流行的C/S系统最大的区别就是计算的过程不再有明显的客户机和服务器的划分。参与系统的每一个节点既是客户机又是服务器。它们既提供服务又享受服务。从某一个单独的节点来看,它向其它节点提供服务的同时,又在享受其它节点提供的服务。这2件不同的任务往往是在同时进行的,当然也可以在某一个时间内只进行其中的一项任务。P2P系统是一种典型的大规模分布式计算系统,在这样的系统中有m个节点,n类服务。我们可以将这样的系统抽象成一个多队列和多服务器的对等服务系统模型。

 为了是我们所说的模型具有一般性,现在做如下假定:

(1)       系统有m个节点,n类服务。将第i类服务记做 ri,j个服务器记做 Sj

 

(2)       设每个服务器包含一个缓冲队列。 Sj  的队列表示为 表示qj,其缓冲空间的容量为 bj

 

(3)       每个任务的到达服从泊松过程。任务 ri 的到达速率为 Vi, ri可以被分配到没m个队列中的任一个队列。当所有队列都重满时,系统不能再接受新的服务请求。

(4)       sjQ

=

 

=

 

=

=

=

=

=

=

=

=

=

wnm

ss 每个服务器服务不同的请求有不同的服务时间。 S j的服务速率为 ,Uj服务速率独立成指数分布

Qij:表示服务器 Sj 接收任务 ri 的逻辑缓冲队列。第一个下表表示接收请求的类型,第二个下表

表示队列所属的服务器。 Qij 的容量限定为 bij Qij中请求 ri 的标识数量记为 M(qij)

ci:表示任务 ri 到来的时间变迁,它有实施速率 Vi

dij:表示将任务 ri 分配到服务器 sj的瞬时变迁,具体的分配方案由P2P系统中的分布式路由选择算法得到的可实施谓词和随机开关来决定。

f:表示具体的路由选择算法

 

Sij:表示服务器 Sj对队列 qij中的任务 ri 实施服务的变迁,它的实施速率 uij = uj/ri , sj对任务 r i的服务时间表达为 Tij = ri/uj 。这里 ri 既代表任务类型,又表示服务时间要求的权重。

vj:表示共享服务器的位置。可以看出,传统存在于服务器的数据和信息被转移到了每一个计算机节点,分散保存,同时每一个计算机节点也在为外界提供信息,服务同样如此;整个网络处于一种均衡的状态中,联入网络的计算机共同分担了网络里信息的交流和传递,网络也不会因为一台或者多台计算机的崩溃而陷入瘫痪。服务的提供者和消费者变得模糊。

5 模型求解

=

=

=

=

=

=

  上述模型一般的性能分析一般有2中方法:一种是根据模型构造对应的马尔可夫链,对整个模型直接求解;还有一种是对模型进行分解,迭代的近似求解。上述模型是一个m x n维的马尔可夫链,随着bij mn的增大,马尔可夫链的状态空间呈指数增长。当状态的数目超过一定的限制后,目前计算机的存储和计算能力将使问题不可以实际求解。所以可行的解法是采用分治法,分解模型和迭代求解子模型之间的相互关系的近似求解。按照这样的设想可以将每个逻辑服务器和其逻辑队列分解成一个子模型。

对于上述系统性能的度量,主要差别来自于任务分配和选择方案的性能优劣。我们这里认为系统的调度,选择控制方案仅依赖系统固有的特性,这些特性参数包括缓冲队列的状态变化和服务器的服务速率及共享的影响。

6 结论

Petri网作为系统性能评价和建模的重要工具,本文在充分分析P2P系统的结构和计算特点之后,提出了基于Perti网的P2P系统性能分析模型:多队列多服务器的对等计算系统。然后提出通过分治法,将这样一个复杂的模型转化为一系列结构类似易于求解的子模型,通过对子模型的求解,最终求解整个模型。目前这是从整体上得到了系统的性能参数,没有考虑路由选择算法f 的作用。 f 可以看作是任务请求的调度方案,接下来可以按照不同的任务调度方案,对系统进行更加详细和精确的性能分析,这是接下来要做一个主要工作。我们可以看出Petri网对于分析这样的大规模并行服务系统的效果很好,同时利用分治法可以充分发挥Petri网形式分析和易于转化为马尔可夫链便于求解的特性。

7 参考文献:

1.计算机网络和计算机系统性能评价 林闯 清华大学出版社 北京 200104

2.基于Peer-to-Peer 的分布式存储系统的设计 , 杨广文, 鞠大鹏Vol.15, No.2 2004 Journal of Software 1000-9825/2004/15(02)0268

3.基于Peer-to-Peer的信息检索系统 , 陆志国, 黄维雄, 钱卫宁, 周傲英 2004 Journal of Software Vol.15, No.9 1000-9825/2004/15(09)1375

4 Watts , D. J. & Strogatz, S. H. Collective dynamics of ‘small-world’ networks. Nature 393, 440 – 442 (1998).

5.基于模糊Petri网模型的通信网络综合性能评价 黄 勇,胡健生,李晴帆

6 Dejan S. Milojicic, Vana Kalogeraki, Rajan Lukose, etc. Peer-to-Peer Computing, HP Laboratories Palo Alto , HPL-2002-57

7Roger Dingledine, Nick Mathewson, and Paul Syverson. Reputation in P2P Anonymity Systems. In workshop on economics of p2p systems 2003

   

 

 

 

 

4 . P2P 性能分析模型
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值