mysql索引 红黑树_为什么MySql索引使用B+树?

本文深入浅出地解释了为何MySQL数据库使用B+树作为索引而非Hash。尽管Hash查找时间复杂度为O(1),但面对多条数据查询,B+树由于其有序性和链表结构,查询效率更高。B+树能够适应数据量大、无法一次性加载到内存的情况,其多路结构降低了树的高度,适合磁盘存储。此外,B+树的所有数据都在叶子节点,便于范围查询,而B树则需要跨层访问,效率相对较低。因此,B+树成为数据库索引的理想选择。
摘要由CSDN通过智能技术生成

前言

面试中我们经常碰到面试官问到数据库索引,问到索引就会问你索引的数据结构。类似这种数据结构对于普通程序员来说记住概念几天就忘了,而且概念不是每个人都能很好都理解,所以针对这一原因,我简单通俗都像大家讲解为什么mysql使用都是B+树,而不用其他的树形结构。

正文

Q1:B+树的查询时间大概多少?

A:跟树的高度有关,是O(log n)。

Q2:hash查找时间大概多少?

A:o(1)。

Q3:hash比B+查找时间更短,为什么索引不用hash?

A:这和业务场景有关,如果只查找一个值的话,hash是一个很好的选择,单数据库经常会选择多条,这时候由于B+树索引有序,并且又有链表相连,它的查询效率比hash就快很多了。而且数据库中的索引一般是在磁盘上,数据量大的情况可能无法一次装入内存,B+树的设计可以允许数据分批加载,同时树的高度较低,提高查找效率。

下面我对第三个问题进行一个解析,让大家更好的记住。

二叉排序树

同一高度下左边跟节点小,右边跟节点大,并且左右子树都是二叉排序的。但是在极端情况下插入的是有序的序列就会变成链表。

所以这时候我们就要对二叉树进行平衡,让插入的时候节点能均匀分布。

红黑树

性质1. 节点是红色或黑色。

性质2. 根节点是黑色。

性质3 每个叶节点(NIL节点,空节点)是黑色的。

性质4 每个红色节点的两个子节点都是黑色。(从每个叶子到根的所有路径上不能有两个连续的红色节点)

性质5. 从任一节点到其每个叶子的所有路径都包含相同数目的黑色节点。

所以引入红黑树,红黑树是平衡树的一种,他的复杂规则都是为了保证树的平衡,所以大家在记概念的时候理解不上去。

我们知道,树形结构的数据查找速度跟树的高度有关,所以尽可能让树平衡就是为了降低树的高度,java里有一种s数据结构底层就用的红黑树,就是TreeSet。

B树

也叫B-树,大家千万不要说B减树。

B树是一种多路搜索树,每个节点都可以有多于两个子节点,M路的B树就是有最多有M个子节点。

这就是一个3路B树

多路的结构就是为了尽可能降低树的高度,使查询速度更快,有一种情况就是无限多路,那就变成一个数组了,所以我们树ArrayList适合用来查询,数组结构的数据都有这个特点。

所以我们常常用B树做文件系统的索引,因为我们文件和数据库的索引都是存在硬盘上的,并且如果数据量大的话,不一定能一次性加载到内存中。所以一棵树无法全部加载到内存里我们怎么查找,这时候就用到我们刚才说到的B树了,我们可以每次加载树的每一个节点,然后一步一步往下查找,而且多路B树每个节点会多于两个子节点,速度会更快,所以我们不用红黑树,因为红黑树子节点只有两个。

B+树

B+树是在B树基础上改造的,他的数据都在叶子节点,同时叶子节点还加了指针。

这是一个四路B+树,叶子节点都数据形成了链表

这也是和业务场景相关的,你想想,数据库中select数据,不一定只选一条,很多时候会选多条,比如按照id排序后选10条。如果是多条的话,B树需要做局部的中序遍历,可能要跨层访问。而B+树由于所有数据都在叶子结点,不用跨层,同时由于有链表结构,只需要找到首尾,通过链表就能把所有数据取出来了。

比如我们查找7到19,B+ 都威力看到了吧。所以小伙伴们回到前文都三个问题中,就知道了为什么MySql索引使用B+树了吧。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值