MySql-索引&事务

最新推荐文章于 2024-08-27 17:23:17 发布

Lullaby—

最新推荐文章于 2024-08-27 17:23:17 发布

阅读量851

点赞数 32

文章标签： mysql 数据库

本文链接：https://blog.csdn.net/2301_78493961/article/details/141037858

版权

在面试中，对于mysql相关的面试题常看的两部分也是我们学习时需要重点了解的内容：索引与事务。

索引

索引的核心内容：底层的数据结构。

索引引入了一些额外的数据结构来加快查询的速度，默认条件下进行条件查询就是遍历表一条一条数据代入条件查询，引入索引就是要通过其他数据结构加快查询的速度，减少遍历表的可能。

哪些数据结构能加快查询的速度？

顺序表->随机存取，链表-》中间位置删改，栈/队列-》特殊位置操作，二叉搜索树（红黑树）；

但是红黑树和哈希表这两个数据结构都不适合用在数据库，原因：

1、哈希表只能查询key相等的情况，大于和小于的范围查询是做不了的；通过hash函数的映射，原来key之间的大小关系不能反应到计算出来的hash值的大小关系，也无法决定下标的关系。

2、对于红黑树呢是可以进行范围查询的，但是对于在红黑树里进行中序遍历找后继节点的方式也未必是高效的，很有可能需要往父亲节点进行一系列回溯才能找到后继

对于原因一可以用过线索化的方式解决，但是要付出更多的存储空间。

原因二：红黑树是二叉搜索树，当元素非常多就会使树非常高，树的高度越高进行查询的效率就越低，高度每增加一层就要增加一次比较的次数，而数据库的数据/索引都是保存在硬盘上的，每比较一次就要进行一次硬盘IO操作，因此红黑树不适合大规模在硬盘上管理数据的情景。

B树

结合上述，于是就引入B树，本质上是N叉搜索树，每个节点上可以存储多个元素，延申出多个子树，同样数量的数据，需要的节点少了，对应树的高度也就大大降低了，大概长这样：

此时拿着要查询的key在某个节点要进行比较时，确实需要更多的比较次数，但这里的比较其实是很高效的，原因：

（1）每个节点上key都是有序排列，比较时可以使用二分查找。

（2）B树会控制每个节点上的key值不会太多，如果还要添加新的数据，那么就会分裂更多的子树出来。

（3）多个数据都是存储在一块连续的空间，进行比较时一次硬盘IO操作就可以读出整个节点，可以直接完成上述操作，也就是多次比较仅需要一次IO操作。

B+树结构

B+树是B树的升级版，还有称为B-树的，也是B树。首先我们看例图：

需要注意B+树结构上的这些特点：

（1）根节点上的最右值30可以认为是这棵树的最大值

（2）每个根节点的子树的值最大值为父节点的值

（3）非叶子节点的值都会在叶子节点出现

针对索引列进行的查询，是从树的根节点一层一层进行查询。针对非索引列查询就是从最底下层的叶子结点遍历链表就行了。

按照上述规则排列数据，此时叶子结点这一层包含整个数据集合的全集。另外B+树会把叶子节点通过链表这样的链式结构串起来，此时就通过上述链式结构非常方便的遍历整个表的所有数据，同时也非常方便进行范围查询。

B+树相对于B树的优势：

（1）非常方便进行遍历和范围查询。

（2）当前任何一次查询操作最终都会落到叶子节点，也就是说查询任何数据经历的硬盘IO次数都是一样的，查询操作消耗的时间是稳定的。

稳定是很重要的，有些时候查询数据可以直接在B树的非叶子节点查询到，查询操作消耗的时间确实是更少了但是有的操作慢有的操作快这件事是非常不稳定的。

（3）由于叶子节点存储了全部的数据，相对应非叶子节点都是重复的数据，所以在非叶子节点可以只保存一个key值，表的每一行的数据都只关联到叶子节点上；这样创建后非叶子节点占用的空间比较小，此时可以把非叶子节点保存到内存中的缓存中，大大提高了查询的效率。

B+树创建

咱们看到的表格是逻辑上的结构，实际底层的结构就是B+树的结构，B+树按照主键的索引的这个B+树的叶子节点来保存每一行数据；如果你的表创建主键了，就会按照主键的索引的B+树创建所有行，如果你没有创建主键，mysql就会生成一个隐藏的主键，按照隐藏主键创建的树来组织数据。查询时如果查询的列不是索引列，那么就会一行一行的全盘遍历。

总结：（这里理解起来可能会有点困难）针对哪个列创建索引就是针对哪个列创建B树，主键索引的B+树叶子节点带有数据行，其他列索引创建的树叶子节点存储主键的id，针对非主键索引查询最终会得到一个主键的id，再拿着这个id去主键索引树查询，这个过程称为回表。