无所不在的互联网中P2P重叠网

本为系转载自中科院的侯自强教授(作者单位:中国科学院声学研究所)

P2P:互联网回归对等本性

无所不在的互联网中P2P重叠网

  80年代以前的计算机是众多用户共享一个主机,计算资源是集中的,80年代以后PC机出现,计算资源从集中走向分布。互联网本身的是分布的、自治的,结点是对等的。WWW网出现,引进客户机-服务器结构,客户机结点使用浏览器访问存储的网站上服务器中的内容,出现了不对等的模式。对等连接peer-peer(P2P)模式的出现,互联网重新回归本性,集中的服务器业务模型再次变成分布的,每一个用户终端既是客户机又是服务器。

<script src="/ads/show350_250.js" type="text/javascript"> </script> <script type="text/javascript"> var YahooCNADConfig=new Array();YahooCNADConfig['adid']=203;YahooCNADConfig['wid']=1100;YahooCNADConfig['w']=350;YahooCNADConfig['h']=250; </script> <script src="http://view.aliunion.cn.yahoo.com/showad.php" type="text/javascript"> </script>   近年来互联网上P2P业务发展迅速,P2P已经成为宽带的杀手级应用。目前P2P应用占宽带流量50-60%(白天)90%(晚上),企业用户的40%MP3和视频文件共享下载的P2P流已经成为宽带互联网业务的主流,基于P2P的即时通信和互联网电话发展迅速,对等广播正在兴起,P2P协同计算和网格方兴未艾

无所不在的互联网中P2P重叠网

  P2P技术将各个用户互相结合成的一个网络,共享其中的带宽、共同处理其中的信息。与传统的客户机-服务器模式不同,P2P工作方式中,每一个客户终端既是客户机又是服务器。以共享下载文件为例,下载同一个文件的众多用户中的每一个用户终端只需要下载文件的一个片段,然后互相交换,最终每个用户都得到完整的文件。

实现P2P的第一步是在互联网上进行检索,找到拥有所需内容和计算力的结点的地址,第二步是通过互联网实现对等连接。为了充分发挥互联网无所不在的优势,不能对互联网协议进行任何修改,解决的方法就是在基础的互联网上架设一个P2P重叠网。

  P2P重叠网分为无组织的P2P重叠网有组织的P2P重叠网两大类。目前在互联网上广泛使用的大多是无组织的P2P重叠网。而有组织的P2P重叠网目前还处于学术界研究阶段。如Tapestry Chord Pastry 、和 CAN 等。正在研究的新一代的P2P应用包括多播、网络存储等都运行在这种有组织P2P重叠网上。

  无组织的P2P重叠网已经演进了四代。第一代P2P网络采用中央控制网络体系结构。早期的Napster就采用这种结构。第二代P2P 采用分散分布网络体系结构。适合在自组织( ad-hoc)网上的应用,如即时通信等。第三代P2P 采用混合网络体系结构。这种模式综合第一代和第二代的优点,用分布的超级结点取代中央检索服务器。目前常用的P2P 软件BitTorrente donkey Gnutella等都属于此类。第四代P2P目前正在发展中。主要发展技术有动态口选择和双向下载。动态口选择需要发展适应P2P应用的分布式管理系统。

分布自治的P2P的应用

  对等连接P2P重叠网应用最能发挥互联网分布和自治的优势,在文件共享下载,瘦客户机分布网络存储,通信和协同计算等各个方面将获得广泛应用。如图所示。

P2P内容共享包括共享文件下载BT eDonkey Gnutella、搜索和检索Bearshare、内容分发、网络存储和对等广播Peercasting等。P2P内容分发如Codeen。当大量用户同时访问一个网络会造成拥塞,采用P2P方法,通过智能结点监视对网站访问请求,一旦出现超常快速增长,系统自动将页面分发到附近的结点。P2P网络存储如Oceanstore。加密的文件被分解成为互相重叠的片断存储在全球各地。即使一些本地的结点损坏,也可以通过一组片断恢复原始的文件。系统为每一个片断分配ID码,当用户需要取回其文件时,他的计算机告诉结点寻找最近的所需要片断,将其组装恢复文件。网络存储可以像水、电一样,作为公用事业基础设施来发展。用户付月租就可以在网上存储数据。简单的付费界面,一个公司的一个帐单,规模越大效果越好。网络存储充分发挥互联网无所不在的优势,移动电话、PDA、笔记本电脑、台式机、电视机、各种家电和传感器等都可以通过各种有线或无线接入连接网络取得服务。

  P2P通信协作包括协同工作、互联网电话、即时通信S和移动通信。Skype 使用快速追踪”(FastTrack)第三代混合 P2P技术即全球索引” (GI - Global Index) 技术,建立超级结点重叠网络构成全球分布式用户数据库,结点对接交换资料。不使用服务器等中央控制设备不仅减少搜索的时间,还可以降低成本。由于这种P2P网络使用了终端本身电脑的处理能力,整个网络的处理能力随着终端数目增加而增加。在全球范围内可与其他 Skype 用户不受限地免费通电话,音质比普通电话好,可以与所有防火墙、NAT 和路由器一起使用,无需进行任何配置。Skype 用户在线并且准备通话或聊天时,显示朋友列表,通话采用端到端加密,极具保密性。Skype20038月推出以来已经使用15种语音,在165个国家发展了600万用户。20047月提供互联网到传统电话之间的通话廉价商业服务。Skype还有 PDA的软件版本,正在发展移动电话和WiFI 双模手机,用它可以选择用移动电话通话或通过WiFISkype通话。 P2P即时通信系统 IM采用对等连接模式P2P,消息格式使用 XML具有有效的报到管理,可以提供异步、并行、可靠和近似实时通信,支持移动报到管理和移动即时通信。使用IETF 标准保证互通互用,如报到、SIP安全和认证保证。

  P2P协同计算包括协作计算、网格和数据内容网格。P2P协同计算网格的一个典型的例子是韩国的Korea@Home (KatH),使用志愿者计算机资源的分布式计算软件平台发展新应用。如虚拟屏幕用于新药设计、金融投资全球风险管理、3D影像透视图等。混合平等对接Peer-to-Peer 体系结构,基于PKI的安全和数字签名有SOAP 消息的Web 服务。

  网格(Grid) P2P协作基本概念非常相似,都是资源共享,但是使用技术不同。网格的目的是利用网络资源进行大规模高性能计算,其利用的网络资源包括超级计算机、集群、专门设备、大规模数据库等。网格需要制定组织级的协议用于资源共享。安全和性能是关键问题。采用基于PKI X.509证书的鉴权和可编程中间件用于高性能计算,P2P协作利用的资源是个人计算机、存储的数字内容等,对资源进行分散控制,允许匿名接入。可测量性是主要优点。采用P2P Grid融合产生数据内容网格,用P2P技术建立数据网格是最有吸引力和实际的方法。综合P2P技术建立内容网格,在网格中数据、内容是自动分布的,用户可以接入最近的数据。

传感器网络是P2P理论和技术最好的实验床。传感器网络将信息高速公路延伸到土路,先在本地计算再通信,比直接传输原始数据效率高。

P2P将开创网络媒体新时代

  电视视频节目除现场直播以外,都是事先录制好存储在服务器中的。点播是一种工作模式,但是它占用网络资源太多。P2P为网络电视媒体提供了一个新的工作模式,用户可以先用P2P方式下载内容存储在自己的计算机中,再回放观看。这种方法对网络要求低,成本低,最适合互联网应用。20046月互联网上P2P视频流量首次超过音频流量,这表明巨大的无形的P2P文件共享网络正在被用来分发电视节目和电影。有人称之为互联网历史上的分水岭,表明互联网宽带对等广播”(peercasting)兴起和无线电电视广播开始走向衰亡。它对视听媒体的影响就象互联网网站对印刷媒体的影响一样。有人提出媒体网(Medianet)观念。发展网络对等广播”(Peercasting)柔性电视”(Flexible TV)20046BBC开始进行其柔性电视”(Flexible TV)第一次有限范围的公共试验。参加试验的用户可以下载“BBC互联网媒体播放器,用它可以下载收看前一周和后一周的 BBC的全部节目。在柔性电视系统中BBC没有设置向用户分发节目的中央服务器,而是采用P2P对等广播”(Peercasting)技术。每一个播放器使用对等连接文件P2P共享软件,实现向用户网络分发内容。节目文件被分解为很多小的片段,每个用户下载存储若干片段再互相对接交换,最后每个用户都得到完整的拷贝。这种方法同时下载用户越多,下载速度越快。所有节目文件实际上被存储在用户终端中。

  由于BBC自己生产制作节目,拥有版权,这种方法不违反知识产权保护,可以快速地检索分发给用户。

  Coolstreaming 是香港研发的一种全新的流媒体播放软件,它的核心技术是P2P,类似BitTorrent,但是不需要全部下载完了再播放,是一种P2P流媒体。今年春节联欢晚会当天该软件CCTV1的使用人数超过8000。该软件现在已经支持凤凰卫视、ESPNHBO电影、CCTV系列等多个电视台的实时转播,同时还提供一些广播节目的转播。

  Coolstreaming可以实现电视视频信号的网络转播。不能大范围接收覆盖的电视台可以利用该技术建立实时的网络转播(免费或DRM付费)提供通达性。可以将不能安排电视台直播的节目在网上直播。例如新浪等网络门户可以提供独家的媒体见面会、娱乐体育盛事、名人网络聊天的实况转播。大型企业利用该技术辅以其它P2P语音手段实现高质量的网络会议转播等。运用这一软件可以开辟个人网络电视台/电台,作为私人媒体向网络大众广播。在校园IPTV方面,也起到很好的效用。清华大学计算中心新近研发的GridMedia ,也在今年的春节联欢晚会上应用,可支持一万多人同时下载。

盗版和流量控制影响P2P的发展

  目前公共互联网上的P2P应用不论在知识产权保护方面还是在防病毒抗攻击等网络安全方面都存在很多问题,制约P2P发展的关键问题是盗版问题和流量控制问题。

P2P是一把双刃剑,用得好,将加速分发的渠道,并避免服务器瓶颈;用得不好,将成为盗版泛滥的平台。《星球大战三》公演当天,网上下载达16000份。美国好莱坞以侵犯版权将BT软件商告上法庭,但是BT软件商认为自己只提供软件的下载并不提供内容,而且不以盈利为目的,构不成侵权。因此,P2P要成为商业运营模式,需要探讨。有趣的是,BT一直是以种子站为基础的,但是最近BT开始实现自动检索,也就是说不需要种子站,依靠系统自动搜索需要的资源。种子站的消失为知识产权保护制造了更多的阻力。

P2P的巨大流量给运营商很大压力,增加运营成本,尤其是网际互联费用。但是封堵P2P会造成客户流失更是运营商所不愿意看到的。不久前网上流传铁通要封BT,铁通总部紧急出面声明辟谣。目前一种解决办法是运营商在其网络服务器中缓冲P2P流以减少外出流量,减少将那网际互联费。

  制约P2P发展的另一个问题是网络流量的不平衡。P2P是混合式结构,有一些超级结点分布在网络关键的地方,可以在这些结点做分布式管理。这个方法目前正在实验阶段。

  分布式管理是P2P的发展趋势

  互联网的规模已经非常庞大,又分别为不同运营商和机构拥有和管理。要想同步改变体系结构几乎是不可能的,而等待各个子网逐步改变又太慢,所以解决这些问题的方法是在保持现有互联网继续工作的同时实现无缝的演进。近年来,国际上正研究在互联网上发展重叠网,以便进行分布式控制并支持P2P重叠网。

  分布式管理这方面的研究工作最具有代表性的是:弹性重叠网RONTapestryPlanetlabTapestry PlanetLab是有计划、有组织的P2P重叠网,同时具有分布式管理功能。

  Tapestry是一种有组织的P2P重叠网,是可扩展的基础设施。分布式的目标定位和选路(DOLR)机制使其具有高性能,并可扩展与位置无关的选路,利用局部资源将消息送到最靠近的终点。这样可以提高效率、减少消息时延并提高吞吐量。

  与高校校园网相关的是PlanetLab。这是一个全球性的民间研究计划,旨在用类似发展Linux开放源代码时的开放合作精神,建立全球分布的研究实验床,连接各处的智能结点,建立Tapestry分布式的目标定位和选路(DOLR)网络。PlanetLab在全球互联网的主要地区设置了智能结点(初期1000),连接骨干网,构成了分布的虚拟计算环境。这些结点可以实现诸如异常检测、鲁棒选路、存储内容分发(尽量接近数据源)、数据融合、提供分散在多个独立域的高生存性存储等功能。而连接这些智能结点的重叠网是重叠在现有的互联网上的,故便于扩展演化。目前Planetlab已经构建了上百种可以在该平台上运行的全新服务,我国的CERNET2已经和Planetlab签约,并在全国12所大学建立了结点。

P2P需要IPv6

  IPv4互联网由于IP地址不够,大量采用专用地址和网络地址变换器NAT,其结果是隐藏了谁是信息的发送者的信息。而P2P 要求能够识别发送者,使用实名制才能建立诚信安全的网络社会。只有IPv6 能够做到这点。建立IPv6网将为发展P2P应用提供安全,可靠和廉价的网络运行环境。P2P的发展和IPv6的推广普及是密切相关的

目前,中国实施的中国下一代互联网(CNGI)计划大规模布设了IPv6骨干网,这为发展P2P应用、建立诚信安全具有分布管理能力的网络环境提供了机会。一方面,在CNGIIPv6网上一开始就可以实行实名制建立网络新秩序;另一方面,在CNGI上以无缝和持续演进的方式建立智能结点重叠网,以支持P2P应用并且提供分布式管理。

  此外在IPv6 网上运行P2P不再需要使用NAT能够控制功能和逻辑,可以简化网络设计。对于运营商而言不再需要考虑NAT及其软件之间的兼容性,在远端不需要服务器,可以降低运营负担。运行成本与使用IPv4NAT时相比要低。

结束语

  下一代互联网NGI要进一步发挥无所不在的优势,需要发展新的应用模式,解决分布管理问题。P2P应用最符合NGI无所不在的分布优势,有着广阔的发展前景。尽管P2P应用还存在管理、安全、运营模式、知识产权和政策法规等问题,但是它对未来网络的影响是不容置疑的。而这些问题也是目前正在研究解决的热点问题,蕴藏着巨大商机。目前开展各种方法的研究,例如在运营商网络服务器中缓冲P2P流以减少外出流量等。建立智能结点重叠网提供分布式管理等。目前也在探讨如何建立新的产业链和运营体制,包括以公共事业方式提供服务等,如PlanetLab 的尝试。

  

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值