P2P数据管理简介-1

P2P网络是一种分布式网络,网络的参与者共享他们所拥有的一部分硬件资源(处理能力、存储能力、网络连接能力、打印机等),这些共享资源能被其它对等节点直接访问而无需经过中间实体。在此网络中的参与者既是资源(服务和内容)提供者(Server),又是资源(服务和内容)获取者。P2P覆盖网络具有非中心化(Decentralization)可扩展性(Scalability)容错性(Failure-tolerance)和负载平衡(Load-balance)等优点。主要应用领域有:P2P覆盖网络模型、分布式存储应用、分布式科学计算,数据管理、文件共享和即时通信等等。

国外,对P2P研究起步较早,并且提出了一些P2P网络模型,如:以NapsterGnutellaCAN, CHORD, Pastry, Tapestry等。在这些网络模型的基础上,开发了如,文件共享、分布式数据存储、数据管理、数据集成等等应用系统。Sun公司以Java技术为背景,开展了JXTA项目;Microsoft公司成立了Pastry项目组,主要负责P2P计算技术的研究和开发工作。现在,国际上对基于P2P的数据管理和分布式数据库处于研究起步阶段,如基于Sun公司的P2P开发平台的EDUTELLA,伯克利大学的PIER系统等等提供了对复杂数据的管理。

我国对P2P研究起步较晚,例如有北京大学网络实验室开发了Maze系统,主要应用是文件共享;清华大学开发的Granary分布式存储系统。可以看出我国对P2P领域的研究和国外相比有一定的差距。我们的课题目标是利用P2P网络作为基础网络模型,来研究复杂数据的在Internet广域网中的管理问题,该领域具有较高的科研价值和应用前景。

尽管P2P已经成功应用于文件共享领域它们,如GnutellaNapsterBitTorre等系统,这些系统仅仅只要对整个文件进行管理,不需要提供复杂数据类型的语义,也缺乏复杂数据管理能力,如关系结构数据,它们只支持基于关键字的简单查询,几乎不支持基于内容的复杂查询。尽管有些P2P数据管理系统具有复杂数据的管理功能,但是他们是基于带有超级节点的混合网络模型,这种拓扑结构过分依赖于超级节点,有悖于P2P的初衷。

现在对基于DHT(Distributed Hash Table)P2P网络是研究热点,主要有拓扑结构,路由算法,查询处理,可扩展型及安全性等等。

我们的系统目标就是要在DHT P2P网络的基础上,增加数据管理层,其主要功能是对用户复杂数据及其元数据分布到 P2P node中;协调规则(Coordination Rule),使得各LDB(Local DB)可以协调工作,实现互操作及数据共享;提供类似SQL的复杂查询(file-sharing Systems only provide extact-match based keywords)。

<如有转载或引用请注明:http://csdn.net/shanjings;作者单劲松>

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值