本文: [
转寄][
转贴][
删除][
修改][
回复][作者:
steadystream][人气:125]
发信人: steadystream(没有肉的人*^_^*), 信区: P2P 标 题: P2P普及系列之七:DHT算法的研究 zz 发信站: 瀚海星云 (2006年11月18日22:08:36 星期六), 站内信件 现有DHT算法由于采用分布式散列函数,所以只适合于准确的查找,如果要支持目 前Web上搜索引擎具有的多关键字查找的功能,还要引入新的方法。主要的原因在于 DHT的工作方式。 基于DHT的P2P系统采用相容散列函数根据精确关键词进行对象 的定位与发现。散列函数总是试图保证生成的散列值均匀随机分布,结果两个内容相 似度很高但不完全相同的对象被生成了完全不同的散列值,存放到了完全随机的两个 结点上。因此,DHT可以提供精确匹配查询,但是支持语义是非常困难的。 目前在DHT基础上开展带有语义的资源管理技术的研究还非常少。由于DHT的精确 关键词映射的特性决定了无法和信息检索等领域的研究成果结合,阻碍了基于DHT的 P2P系统的大规模应用。 P2P发现技术中最重要的研究成果应该是基于small world理论的非结构化发现算 法和基于DHT的结构化发现算法。尤其是DHT及其发现技术为资源的组织与查找提供了 一种新的方法。 随着P2P系统实际应用的发展,物理网络中影响路由的一些因素开始影响P2P发现 算法的效率。一方面,实际网络中结点之间体现出较大的差异,即异质性。由于客户 机/服务器模式在Internet和分布式领域十几年的应用和大量种类的电子设备的普及 ,如手提电脑、移动电话或PDA。这些设备在计算能力、存储空间和电池容量上差别 很大。另外,实际网络被路由器和交换机分割成不同的自治区域,体现出严密的层次 性。 另一方面,网络波动的程度严重影响发现算法的效率。网络波动(Churn、fluctuation of network)包括结点的加入、退出、失败、迁移、并发加入过程、网络分割等。 DHT的发现算法如Chord、CAN、Koorde等都是考虑网络波动的最差情况下的设计与实 现。由于每个结点的度数尽量保持最小,这样需要响应的成员关系变化的维护可以比 较小,从而可以快速恢复网络波动造成的影响。但是每个结点仅有少量路由状态的代 价是发现算法的高延时,因为每一次查找需要联系多个结点,在稳定的网络中这种思 路是不必要的。 同时,作为一种资源组织与发现技术必然要支持复杂的查询,如关键词、内容查 询等。尽管信息检索和数据挖掘领域提供了大量成熟的语义查询技术,由于DHT精确 关键词映射的特性阻碍了DHT在复杂查询方面的应用。 |
P2P普及系列之七:DHT算法的研究 zz
最新推荐文章于 2024-09-04 14:45:59 发布