mysql为什么不使用二叉树,MYSQL 索引为什么使用B+树,而不是 B 树,二叉树:

如何评价索引的好坏:

数据库服务器有两种存储介质,硬盘和内存,为了数据安全,索引需要存放在硬盘上,这样在硬盘上进行查询时,就会产生硬盘的I/O操作,索引的查找次数也就是硬盘I/O的操作次数,所以索引需要减少硬盘的I/O操作。

二叉树:

普通农的二分查找树,有可能退化成一条链表,这是查找数据的时间复杂度为 O(n)。

为此,有平衡二叉搜索树(AVL树, 树堆,红黑树、伸展树等)搜索时间复杂度是 O(log2n)。

对于 数据库索引来说,O(log2n)仍然太大。

B树:

875eb8ba24b4

image.png

Balance Tree,平衡的多路搜索树,即 每个节点不再是只有2个子节点,而是有M个子节点,它的高度远小于平衡二叉树的高度。

B树的每个节点最多包含M个子节点,M成为B树的阶。每个磁盘块中包括了关键字和子节点的指针。如果一个磁盘块中包括了x 个关键字,那么指针数就是x + 1.对于一个100阶的B树来说,如果3层的话,最多可以存储约100万的索引数据。

l 根节点的儿子树的范围是 [2, M]

l 每个中间节点包含 k – 1个关键字和 k 个孩子,孩子的数量 = 关键字的数量 + 1, k 的取值范围为[ceil(M/2), M]

l 叶子节点包括 k – 1 个关键字(叶子结点没有孩子)。

l 每个 关键字 key,划分了一个数据范围,也就是子节点的数据范围。

l 所有叶子节点位于同一层。

在B树的搜索过程中,比较的次数并不少,可以把数据读取出来,然后在内存中比较,这样相比于平衡二叉树来说,磁盘I/O操作要少,在数据查询中比平衡二叉树效率要高。

B+ 树:

B+ 树对 B树做了改进:

l 有k个孩子的节点就有k个关键字,也就是孩子数量=关键字数量。

l 非叶子节点的关键字也会同时存在于子节点中,并且是在子节点中所有关键字的最大(或最小)

l 非叶子节点仅用于索引,不保存数据记录,跟记录有关的信息都放在叶子结点中,而在B树中,非叶子节点既保存索引,也保存数据记录。

l 所有关键字都在叶子节点出现,叶子节点构成一个有序链表,而且叶子节点本身按照关键字的大小从小到大顺序链接。

875eb8ba24b4

image.png

B 树相对于 二叉树,更加矮胖,可以减少查找次数(I/O次数);

B+ 树相对于 B树,由于数据都在叶子节点当中,所以可以把索引一次性加载到内存中,减少I/O次数;同时由于叶子节点是一个有序链表,可以加快关键字的范围查询。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值