MySql索引为什么用B+树

本文主要从数据结构的角度来分析

1、链表结构

从时间复杂度的角度分析:

1)直接遍历的话,查询的时间复杂度为O(n),远大于其他的数据结构。

2)使用数组+二分查找的方式,查找效率可以提升为O(logn),但插入和删除的效率则非常低。

2、平衡二叉树

1)查找的时间复杂度为O(logn),效率与深度有关(本文未分析普通二叉树,因为普通二叉树可能由于节点数过多,退化成为链表,导致查询效率变低)

2)为什么不使用平衡二叉树:首先在查询的效率上,二叉树是满足的,但是其主要不能作为索引结构的原因在于平衡二叉树的节点是逻辑上相邻的节点,但并非物理上相邻的节点。其次,索引通常是非常大的,因此每次只能从磁盘中读取一个磁盘也得数据到内存中,而磁盘的读速度比内存中的数据读取慢很多

红黑树不作为索引结构的原因和平衡二叉树大体一致。

3、哈希表

对于简单的查询,比如单个查询,哈希表可以快速地定位到数据的位置。但它不支持顺序查询和范围查询,从而会更多次的增加磁盘的IO操作,造成读取的效率低下。

4、B树

B树其实是能够作为索引的:B树充分利用了磁盘预读功能来创建的一种数据结构。

预读:当B树作为索引结构时,每次读取都会进行预读,即使只需要一个字节,磁盘也会从读取位置开始,顺序向后读取一定的长度。(依赖于局部性原理)

局部性原理:当一个数据被用到时,其附近的数据通常也会被用到。(以上的红黑树和平衡二叉树就不能使用此原理,因为逻辑上相邻的节点在物理上可能很远)

B树每个节点都可以存储很多关键字,它将节点大小设置为磁盘页大小,充分利用了于都功能,每次读取磁盘页时就会读整个节点。

5、B+树比B树更适合

B+树的关键字全部存放在叶子节点中,非叶子节点做索引,每两个相邻叶子节点中存在一个指针指向下一个叶子节点。B+树最大的好处是,在范围和顺序查询时,B树当读取完一个叶子节点后,会重新进行查询下一个叶子节点的地址,增加磁盘IO的次数;而B+树只需找到一个叶子节点就可以直接遍历查询 。

B树提高了IO性能,但并没有解决元素遍历效率低下的问题,B+树只需要去遍历叶子结点就可以实现整棵树的遍历,不需要额外的IO次数,而数据库的查找在基于范围的查询是很频繁的。

B+树方便扫库,查询多位基于范围查找。

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值