B树与B+树索引

B 树

数据库结构使用树的结构索引,从算法逻辑上看,二叉查找树的查找速度和比较次数都是最小的。数据库的索引存储在磁盘上,当数据量比较大的时候,索引的大小可能有几个G 甚至更多。

当我们利用索引查询的时候,不可能把整个索引加载到内存,能做的只有逐一加载每一个磁盘页,磁盘页对应索引树的节点。

当利用二叉查找树时,每一层都是进行一次IO操作(即把对应的索引装入内存),因此最坏的情况下,磁盘的IO次数就等于索引树的高度。

为了减少IO次数,就需要把层数降低,也就是B-树
B树是一种多路平衡查找树,每一个节点最多包含k个孩子,k称为b树的阶,k的大小取决于磁盘页的大小,

m阶b树具有以下的特征。

1.根结点至少有两个子女。
2.每个中间节点都包含k-1个元素和k个孩子,其中 m/2 <= k <= m
3.每一个叶子节点都包含k-1个元素,其中 m/2 <= k <= m
4.所有的叶子结点都位于同一层。
5.每个节点中的元素从小到大排列,节点当中k-1个元素正好是k个孩子包含的元素的值域分划。
这里写图片描述

B + 树

B+ 树是B 树的一种变体,比B树的查询性能更高。
这里写图片描述

1.有k个子树的中间节点包含有k个元素(B树中是k-1个元素),每个元素不保存数据,只用来索引,所有数据都保存在叶子节点。
所有的叶子结点中包含了全部元素的信息,及指向含这些元素记录的指针,且叶子结点本身依关键字的大小自小而大顺序链接。
3.所有的中间节点元素都同时存在于子节点,在子节点元素中是最大(或最小)元素。

B+树的好处主要体现在查询性能上,单点查询时,由于B+树中间节点没有数据,所有同样的磁盘页可以容纳更多的节点,也就是说,在数据量相同的情况下,b+ 树的结构比b树更加矮胖,IO次数也就更少。B+ 树的查询必须查到叶子节点,B树查询到匹配元素即可,所以B树查询性能不稳定。范围查询时,B 树只能中序遍历,而B+树只需要在链表中做遍历即可。所以B+ 树范围查询更加方便。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值