MySQL索引(一)为什么使用b+tree

MySQL官网对于索引的定义:

索引是帮助MySQL高效获取数据的数据结构!

MySQL的使用主要就包括增删改查,要想实现这些,我们首先就要定位到数据,因此搜索算法是很必要优化的,常见的搜索算法如顺序搜索O(n),这肯定不在考虑范围之内

二分查找 O (log(n))  和 二叉树查找(log(n))   都还不错,但是这俩个搜索算法需要一定的数据结构,二分查找需要存储的数据是有序的,二叉树查找只能应用在二叉树上!

所以数据库的设计者

采用B-tree或者b+tree树来作为数据存储的结构

同样是二叉树,为什么不采用二叉搜索树或者AVL树呢?

因为ALV树要维护树的平衡,其次是树的高度会很大,二叉搜索树高度同样很大

首先我们要明确一点,查询一条数据所需要执行的次数,取决于树的高和树的度

二叉搜索树和AVL树的搜索高很明显大于b-tree而度又小于b-tree  

其次索引作为一种存储结构,他其实也不一笔不小的内存开支,因此 ,MyQL不会把索引存储在内存中,而是存储在文件系统中,InnoDB有俩个文件系统 存储表结构  一个存储索引和数据 MyISAM有三个文件系统,它的不同之处就是索引和数据是分开存的。

要想知道查询之间的好坏,那我们就要去分析主存存取和磁盘存储原理 

系统在磁盘上的I/O速度比在主存中要慢了几百倍

主存

目前计算机使用的主存基本是RAM,也就是随机读写存储器,它的工作原理很复杂,抽象来说,就是一个个存储单元组成的矩阵,当系统要读取主存的时候,将地址总线传导给主存,主存读取到地址信号后,解析信号定位到存储单元,然后将此单元数据放在数据总线上,供其他部件读取 

磁盘存储原理 

基于磁盘结构他的读写时间分为三个部分寻道时间 旋转时间 传送时间,相比主存I/O速度慢了几百倍不止 
因此MySQL采用预读机制来读取,这样只需要在旋转的时候多旋转一部分,就能把连续的数据也给读取,

而取决I/0性能就在于读取的次数 所以我们选择b+tree

在实际存储过程中,其实树高h很小 度d比较大 d越大索引的性能远大,出度的上限取决与节点内key和data的大小

相比b-tree  其实b+tree树更适合存储
 

原因在于每个指针的上限为2d+1  内节点不存储data 只存储key 叶子节点不存储指针 

b-tree将数据data和key存放在一起,因此在搜索的时候最优为O(n),但不适合区间访问,

而b+tree优化之后由于叶子节点之间维护了链表指针,在进行全局搜索的时候十分方便,更大的度空间也使得内节点可以存储更多的key降低了树的高度

补充一下:设计者将节点的大小设置为页,符合系统读取

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

毛毛怪不奇怪

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值