MySQL索引与树总结、实验

用于查找的树结构(多路查找树)

  • B-树:就是平衡的多路查找树,相比二叉查找树(BST),B-树的出度更大,可以有效降低树的高度,从而减少IO读写的次数。以下都是它的特例或变种。
  • 2-3树(用红黑树实现)–>2-3-4树–>B树–>B+树
    • 2-3树是一颗自平衡树,稳定的情况下节点最多可存2个Key。红黑树则是在BST的基础上加入红黑节点和左旋右旋操作,即其本质上仍是一颗BST。
    • 2-3-4树:跟2-3树一样,都是B-树的特例,只是节点可存储的Key更多,所以树的高度会相对来说更低(同等节点)
    • B-树(B“杠”树):就是一个节点可以多几个Key。到这里,心里总该有点B-树了,但是为什么还会提出B+树呢?
    • B+树与B-树相似,区别在于:B+树的非叶子结点只包含导航信息,只有在叶子节点才可能命中目标Key,而且所有叶子节点和先练的节点使用链表相连,便于“区间查找和遍历”。这样改造的优点在于:
      1. B+树只有在叶节点不包含数据域,在内存页中能够存放更多的key,能够更好的利用“空间局部性”
      2. B+树的叶子结点是相连的,因此对整棵树的遍历只需要一次线性遍历叶子结点即可,有利于区间查询和搜索。

非聚集与聚集(MyISAM VS InnoDB)

  • 非聚集:索引与数据文件分开,B+树叶子节点记录的是数据记录的地址,需要先在索引中找到地址再去磁盘寻址。MyISAM的实现形式。
  • 聚集:在InnoDB中,B+树的叶子结点data域保存了完整的数据记录。
    在这里插入图片描述
  • MyISAM与InnoDB在辅助索引上的另一个区别:
    • MyISAM的辅助索引的data域仍是地址
    • 而InnoDB的辅助索引的data域是该记录的主键,也就是说找到所要定位的数据记录对应的字段,也就直接拿到了该记录的主键

实验

稍后补充。。

补充

  1. 主键聚集保证的函数是逻辑上连续,而不一定是物理上连续(首先要理解的是,在B+树的叶子节点上,并不是直接得到给定键值的具体行,而是会根据B+树给的信息找到并加载目标行所在的页,然后数据库通过把页读入到内存,再在内存中的表中查找),通过对实际数据页的分析,其其聚集索引树的构造大概如下图。就跟B+树叶节点示意图一样,页面是通过双向链表进行维护的,物理存储上可以同样不按照主键存储。将对存储空间的使用比喻成数组(连续存储)和链表,显然如果数据表经常会有删改的情况出现时,用数组的维护成本明显比链表高。在这里插入图片描述
  2. B+树索引并不能找到给定键值的具体行,能找到的只是被查找数据行所在的页,然后数据库通过把页读入到内存,再在内存中进行查找。
  3. 索引中多列的顺序?以MySQL官方提供的employees.titles为例,Key_name相同的表示是同一个索引里面的不同索引列。为什么会有多个列呢?这种叫做多列索引,举个例子,假设有一个sjobs的人在简历中有很多不同的学历(博士>硕士>学士),我要查询他在某个学历期间的成就,那我可以简历一个多列索引,包括(名字,学历),当我使用select 成就 from t_resume where name='sjobs' and edu_bg='硕士'来查询sjobs硕士期间的经历,那名字这个索引列首先能够命中sjobs这个人相关的记录,然后使用edu_bg这个第二级的索引列能够更快地找到他硕士期间的经历,就体现在这里。
    在这里插入图片描述

参考资料

  1. MySQL索引背后的数据结构及算法原理
  2. 《MySQL技术内幕 InnoDB存储引擎》
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值