Mysql 为什么使用 B+Tree 作为索引结构

文章探讨了B+树作为数据库索引的优化策略,尤其是在MysqlInnoDB中,B+树通过减少磁盘IO次数、提高范围查询效率和稳定数据检索,解决了特定场景下的性能问题。同时强调技术选型应针对具体场景而非一概而论。
摘要由CSDN通过智能技术生成

常规的数据库存储引擎,一般都是采用 B 树或者 B+树来实现索引的存储。
因为 B 树是一种多路平衡树,用这种存储结构来存储大量数据,它的整个高度会相比二叉树来说,会矮很多。
而对于数据库来说,所有的数据必然都是存储在磁盘上的,而磁盘 IO 的效率实际上是很低的,特别是在随机磁盘 IO 的情况下效率更低。
所以树的高度能够决定磁盘 IO 的次数,磁盘 IO 次数越少,对于性能的提升就越大,这也是为什么采用 B 树作为索引存储结构的原因。
但是在 Mysql 的 InnoDB 存储引擎里面,它用了一种增强的B 树结构,也就是B+树来作为索引和数据的存储结构。
相比较于 B 树结构,B+树做了几个方面的优化。

  1. B+树的所有数据都存储在叶子节点,非叶子节点只存储索引。
  2. 叶子节点中的数据使用双向链表的方式进行关联。
    使用 B+树来实现索引的原因,我认为有几个方面。
  3. B+树非叶子节点不存储数据,所以每一层能够存储的索引数量会增加,意味着B+树在层高相同的情况下存储的数据量要比 B 树要多,使得磁盘 IO 次数更少。
  4. 在 Mysql 里面,范围查询是一个比较常用的操作,而 B+树的所有存储在叶子节点的数据使用了双向链表来关联,所以在查询的时候只需将两个节点进行遍历就行,而B 树需要获取所有节点,所以B+树在范围查询上效率更高。
  5. 在数据检索方面,由于所有的数据都存储在叶子节点,所以 B+树的IO 次数会更加稳定一些。
  6. 因为叶子节点存储所有数据,所以 B+树的全局扫描能力更强一些,因为它只需要扫描叶子节点。但是 B 树需要遍历整个树。
    另外,基于 B+树这样一种结构,如果采用自增的整型数据作为主键,还能更好地避免增加数据的时候,带来叶子节点分裂导致的大量运算的问题。
    总的来说,我认为技术方案的选型,更多的是去解决当前场景下的特定问题,并不一定是说B+树就是最好的选择,就像 MongoDB 里面采用 B 树结构,本质上来说,其实是关系型数据库和非关系型数据库的差异。
  • 6
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

默海情深以往

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值