多维数据桶方法

【研究背景】
当数据规模很大时,大量数据需要存储在硬盘上,而不能存储在主存上。这时候每个节点的扇出是有限的,在树的层次上做到1到d次检验的存储结构就不能在使用。因为我们每次访问节点都必须得做一次磁盘访问,这是不现实的。因此研究出了桶方法。
【两类方法】
第一类:将数据对象聚集在所在空间中。
第二类:利用恰当的访问结构将数据所在空间进行分解。
【树目录方法】
树访问结构构成了树目录桶方法的基础。此方法和R-树类似,将数据点聚集成一组集合(点桶)。这些集合对应原有访问结构T的一棵子树S。和R-树相似的地方在于T的中间节点(非叶子节点)也聚集在桶中(区域桶),这种结构定义为多路树(例如B-树)。它与桶PR四叉树、桶PRK-D 树,桶PMR四叉树等结构(仅仅把叶子节点的内容聚集到桶中)不同。区域桶的元素树区域。
树状访问结构与R-树也有区别:
1.该结构一般是隐式地对树节点生成的空间进行聚集。
2.每个层次上的所有节点都是不相交的,它们通常能够生成整个空间。
相反R-树必须满足一下两个条件:
1.空间聚集必须通过存储最小包围盒的方式显示表示,这些最小包围盒应与子树节点生成的空间相对应。
2.包围盒可以重叠。
【几种树目录方法】
内容为T中间节点的区域桶R对应于T的一棵子树,扇出值对应R所表示子树的叶子节点个数。(区域桶所表示的子树的叶子节点是访问结构T的中间节点)
K-D-B树——概念层面最简单的树目录方法(当一个节点溢出的时候,可能需要分裂很多节点)
混合树——K-D-B树的一种变形(跟踪了一些额外信息,减少了因溢出而引起的分裂节点数。但是结果区域有可能相交会是搜索变复杂)
LSD树——克服了K-D-B树的缺点但是可能导致较低的存储利用率。
hB-树——模块可以不是矩形,提高了存储利用率。
BV-树——一种具有极好查询性能的新方法。
基于广义K-D树的静态方法。
这些方法结构我会陆续更新出来,大家敬请期待。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值