mysql为什么使用B+树作为索引的结构

      在说B树之前,先来说一下数据库吧. 数据库就是存数据的,查询数据要快,就需要给数据建立索引,就想书要建立目录一下,建立了索引,那这个索引是怎么排序呢?或者说索引的结构是什么样的呢?

       在算法中,有一个大家都只知道的算法就是二分法,在大数据量的是时候查询效率是比较高的. 说到二分法在数据结构中有一种二叉树,查询原理就是基于二分法,但是二叉树有缺陷,就是容易"偏瘫",数据不能很均匀的分布在树的分支上面. 所以就有了红黑树,红黑树可以通过左旋右旋,让数据分布均匀,但是还有缺陷,就是树太高了,查询一个数据的的IO次数就会很高.这次就又有了B树,关于B树的一些特点可以看下面.其中有一点就是在分支的节点也存储了数值,也建立了索引,这对于数据查询来说,是好的,但是cpu每次读取数据库的大小是一定的,而且耗费的性能也是比较高的.这样综合起来,应该每次IO的数据更多一些,把数据读到内存中,在进行排序花费的性能就比较小了.这然后就有B+树,关于B+树的一些特点,后文也有讲到.

二叉树

b树   

  一个M阶的b树具有如下几个特征: (如下图M=3)(下文的关键字可以理解为 有效数据,而不是单纯的索引)

  1. 定义任意非叶子结点最多只有M个儿子,且M>2;
  2. 根结点的儿子数为[2, M];
  3. 除根结点以外的非叶子结点的儿子数为[M/2, M],向上取整; (儿子数:[2,3])
  4. 非叶子结点的关键字个数=儿子数-1;(关键字=2)
  5. 所有叶子结点位于同一层;
  6. k个关键字把节点拆成k+1段,分别指向k+1个儿子,同时满足查找树的大小关系。(k=2)

     有关b树的一些特性,注意与后面的b+树区分:

  1. 关键字集合分布在整颗树中;
  2. 任何一个关键字出现且只出现在一个结点中;
  3. 搜索有可能在非叶子结点结束;
  4. 其搜索性能等价于在关键字全集内做一次二分查找;

B+树

b+树,是b树的一种变体,查询性能更好。m阶的b+树的特征:

  1. 有n棵子树的非叶子结点中含有n个关键字(b树是n-1个),这些关键字不保存数据,只用来索引,所有数据都保存在叶子节点(b树是每个关键字都保存数据)。
  2. 所有的叶子结点中包含了全部关键字的信息,及指向含这些关键字记录的指针,且叶子结点本身依关键字的大小自小而大顺序链接。
  3. 所有的非叶子结点可以看成是索引部分,结点中仅含其子树中的最大(或最小)关键字。
  4. 通常在b+树上有两个头指针,一个指向根结点,一个指向关键字最小的叶子结点。
  5. 同一个数字会在不同节点中重复出现,根节点的最大元素就是b+树的最大元素。

为什么选用B+树作为数据库的索引结构:

  1. B+树的中间节点不保存数据,是纯索引,但是B树的中间节点是保存数据和索引的,相对来说,B+树磁盘页能容纳更多节点元素,更“矮胖”;
  2. B+树查询必须查找到叶子节点,B树只要匹配到即可不用管元素位置,因此b+树查找更稳定(并不慢);
  3. 对于范围查找来说,B+树只需遍历叶子节点链表即可,B树却需要重复地中序遍历,在项目中范围查找又很是常见的
  4. 增删文件(节点)时,效率更高,因为B+树的叶子节点包含所有关键字,并以有序的链表结构存储,这样可很好提高增删效率。

参考资料:http://www.cnblogs.com/xueqiuqiu/articles/8779029.html

 

  • 2
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值