MySQL性能优化1-MySQL索引机制（B+ Tree）

最新推荐文章于 2024-08-17 15:04:11 发布

小野兽冲鸭

最新推荐文章于 2024-08-17 15:04:11 发布

阅读量244

点赞数

分类专栏：知识点数据库

本文链接：https://blog.csdn.net/WM_CARA/article/details/93382666

版权

知识点同时被 2 个专栏收录

25 篇文章 0 订阅

订阅专栏

数据库

11 篇文章 0 订阅

订阅专栏

索引是谁实现的

什么是索引

B+ Tree

MySQL B+ Tree的实现（主要InnoDB MyISAM中)

索引是谁实现的

存储引擎是在表上实现的，一个库中的表可以使用不同的存储引擎。索引就是由存储引擎来实现的。

什么是索引

正确的创建合适的索引是提升数据库查询性能的基础。

索引：索引是为了加速对标中数据行的检索而创建的一种分散存储数据结构。

如上图中，如果现在有一条sql语句select * from teacher where id = 101，在没有索引的情况下，我们要找到这条记录，需要进行全表扫描，匹配id=101的数据。如果有了索引，我们就可以快速的通过索引找到101所对应的行记录在磁盘中的位置，再根据给定的地址取出对应的数据。

使用索引的好处：

索引能极大的减少存储引擎需要扫描的数据量
索引可以把随机IO变成顺序IO
索引可以帮助我们在进行分组，排序等操作时，避免使用临时表。

B+ Tree

首先，复习一下各种树的定义

满二叉树：除最后一层无任何子节点外，每一层上的所有结点都有两个子结点的二叉树。

完全二叉树：如果一个二叉树的深度为h，其它各层（1~h-1）的节点个数都达到最大个数，第h层所有的节点都连续集中在最左边，这就是完全二叉树。

二叉搜索树：对于一个节点，若其左子树不为空，则其左子树的值均小于这个根节点的值，若其右子树不为空，则其右子树的值均大于这个根节点的值。左、右子树也分别为二叉搜索树。没有键值相等的节点。

AVL（平衡二叉树）：AVL是一种自平衡二叉查找树，节点的子节点的高度差不能超过1.平衡是通过左旋转和右旋转来实现的。

红黑树：红黑树是一种自平衡二叉查找树。节点是红色或黑色；根节点是黑色的；每个红色节点的两个子节点都是黑色的。（从每个叶子到根的所有路径上不能有两个连续的红色节点）；从任意节点到其每个叶子的所有路径都包含相同数目的黑色节点。

首先红黑树是不符合AVL树的平衡条件的，即每个节点的左子树和右子树的高度最多差1的二叉查找树。但是提出了为节点增加颜色，红黑是用非严格的平衡来换取增删节点时候旋转次数的降低，任何不平衡都会在三次旋转之内解决，而AVL是严格平衡树，因此在增加或者删除节点的时候，根据不同情况，旋转的次数比红黑树要多。所以红黑树的插入效率更高！！！AVL的查询效率更高。

多路查找树：每一个节点的孩子树可以多于两个，且每一个节点处可以存储多个元素。由于它是查找树，所以元素之间存在某种特定的排序关系。

B Tree：B Tree是一颗多路查找树，B Tree是一颗绝对平衡树（对于任意一个节点，左右子树高度相等）。2-3树是B树的特列，节点最大的孩子数目称为B树的阶，2-3树是3阶B树。

B+ Tree：B+ Tree是B树的变种，有着比B树更高的查询性能。

有m个子树的节点包含有m个元素（B Tree中是m-1）
根节点和分支节点中不保存数据，只用于索引，所有数据都保存在叶子节点中
所有分支节点和根节点都同时存在于子节点中，在子节点元素中是最大或者最小元素
叶子节点会包含所有的关键字，以及记录指向数据记录的指针，并且叶子节点本身是根据关键字的大小从小到大顺序连接

接着，为什么选用B+ Tree作为索引？

看一下二叉树

缺点：当数据分布不均衡的时候，可能退化为一个链表，查找效率低。

看一下AVL树：

缺点：它太深了：数据处的深（高）度决定着他的IO次数，IO操作耗时大。理解：每次读取一个节点信息都要将其从磁盘加载到内存中。它太小了：每一个磁盘块保存的节点数量比较少，数据量就小；没有很好的利用操作磁盘的交换特性；也没有利用好磁盘IO的预读能力（空间局部原理），从而带来频繁的IO操作。交换特性：磁盘每次能和内存交换4k大小的数据，但是一个节点的信息明显比4k小的多。预读能力：当从磁盘读取信息的时候，如果先读了4K，就会认为接下来将使用相邻的4k数据，将进行读取。

看一下B Tree