MySQL选择B+Tree的原因总结

前言

之前暑期实习的时候对于数据库了解很少,其实也有一部分是因为课堂学的和企业生产用的不对口,被问得一脸懵,最近狠狠补了一下,遇到这个问题,搜集资料之后得到答案。

正文

更准确地说,B+Tree是MySQL的InnoDB引擎使用的存储方式,我们主要对比红黑树,b树,b+树三者,三者不再做详细介绍,只进行对比分析。主要核心点有二:

  • 树高要低
  • 范围查询效率

树高

树高影响I/O次数,每次访问节点就需要I/O一次,很慢,他们的关系是:树高差不多等于需要的随机I/O次数。

如果节点太大,那么一个节点也可能需要多个I/O。并且只有b树或者b+树需要考虑这个问题,因为红黑树一个节点就存放一个数据,但MySQL已经考虑了这个问题,把节点设置成一页的大小,因为就算只取1B数据操作系统也会取回一页,所以这样设置可以最大化利用。但是因为不少操作系统有磁盘预读功能,在取回一页的时候,根据空间局部性,会预读取若干页(具体是多少页,没有查到,所以MySQL实际上一个节点是若干页的大小,一般4KB一页,节点默认大小16KB。

显然高度越低越好,出度越大,或者说一个节点能拥有更多儿子,树高越低,这一点上b树和b+树明显胜利。但若仔细分析,b+树其实比b树要优秀一些,因为b+树的非叶子节点不存放数据,而b树的非叶子节点要存放数据,那么b+树就能比b树多一些出度,因为能存下更多的间隔值,从而对整个树来说,存放更多的数据。

范围查询

范围查询是MySQL中经常会遇到的一个询问形式,例如查询某个表某一列在某个区间内的数据,或者说找一下价格在10到20之间的商品。

对于范围查询,红黑树和b树流程差不多,首先是找到左端点,然后递归,即做中序遍历。但b+树由于只在叶子节点存放数据,并且它做了一个操作,把相邻的叶子串成链表,这样在范围查询的时候,只需先找到左端点,即可当作自己在一个有序链表上,这样进行范围查询方便简单,效率也会高一些,因为不需要做什么额外操作,只需要沿着链表走就可以了。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值