B树(B-树)、B+树

本文介绍了B树和B+树的概念、特征及在数据库中的应用。B树与B+树是多路平衡查找树,用于解决大规模数据存储中降低磁盘I/O次数的问题。B+树在数据库索引中表现更优,尤其在范围查询上,所有数据都在叶子节点,形成有序链表,适合区间查询。B+树还有稳定的查询性能和较低的磁盘IO次数,常用于文件系统和数据库中。
摘要由CSDN通过智能技术生成

一、B树的引入

二叉查找树(Binary Search Tree),平衡二叉查找树(Balanced Binary Search Tree),红黑树(Red-Black Tree ),B-tree/B±tree/ B*-tree (B~Tree)。前三者是典型的二叉查找树结构,其查找的时间复杂度O(log2N)与树的深度相关,那么降低树的深度自然会提高查找效率。

在大规模的数据存储中,实现索引查询这样的背景下,树节点存储的元素数量是有限(如果元素数量非常多,查找就退化成节点内部的线性查询),这样导致二叉查找树的结构由于树的深度过大而造成磁盘I/O读写过于频繁,进而导致导致查询效率低下。因此通过降低树的深度来解决的问题(节点的子树数量有限)。

磁盘查找顺序:柱面(柱面号)->磁道(盘面号)->磁道段(块号)
磁盘查找时间组成:查找时间Ts(代价最大)+等待时间Tl+传输时间Tt
磁盘读取数据以盘块(block)为基本单位。位于用一个盘块的所有数据能被一次性全部读出来。因此我们应该尽量将相关的信息存放在同一个盘块中,同一个磁道中。或者至少放在同一个柱面或者相邻柱面上,以减少磁头来回移动的次数,避免过多的查找时间Ts

受平衡二叉树的启发,提出多路平衡查找树。

在这里插入图片描述假如每个盘块可以正好存放一个B树的结点(正好存放2个文件名)。那么一个BTNODE结点就代表一个盘块,而子树指针就是存放另外一个盘块的地址。

下面,模拟下查找文件29的过程:

  • 根据根结点指针找到文件目录的根磁盘块1,将其中的信息导入内存。【磁盘IO操作 1次】
  • 此时内存中有两个文件名17、35和三个存储其他磁盘页面地址的数据。根据算法我们发现:17<29<35,因此我们找到指针p2。
  • 根据p2指针,我们定位到磁盘块3,并将其中的信息导入内存。【磁盘IO操作 2次】
  • 此时内存中有两个文件名26,30和三个存储其他磁盘页面地址的数据。根据算法我们发现:26<29<30,因此我们找到指针p2。
  • 根据p2指针,我们定位到磁盘块8,并将其中的信息导入内存。【磁盘IO操作 3次】
  • 此时内存中有两个文件名28,29。根据算法我们查找到文件名29,并定位了该文件内存的磁盘地址。

分析上面的过程,发现需要3次磁盘IO操作和3次内存查找操作。关于内存中的文件名查找,由于是一个有序表结构,可以利用折半查找提高效率。至于IO操作是影响整个B树查找效率的决定因素。


二、B树的定义与特征

B树(即B-树,B-Tree,

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值