MySQL索引原理

String NUll

已于 2024-07-10 14:53:39 修改

阅读量161

点赞数

分类专栏： # MySql 文章标签： mysql 数据库

于 2020-03-02 17:45:51 首次发布

本文链接：https://blog.csdn.net/java_liuyuan/article/details/104612296

版权

MySql 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

什么是索引？

一句话总结：索引是帮助MySQL快速高效获取数据的排好序的数据结构；

索引常见的数据结构：

二叉树
红黑树
Hash表
B-Tree

数据库不用索引

如果我们数据库建表时不建索引直接查询，数据库只能遍历比较，时间复杂度为：O(n)；

二叉树

![二叉树](https://img-blog.csdnimg.cn/20200302161412959.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2phdmFfbGl1eXV

比如我们查询索引为10的数据，遵从树结构左小右大的原则，三次就可以查询出想要的索引，根据索引获取数据磁盘地址，时间复杂度为：O(log n);

但是二叉树有一个问题，如果从根节点是到叶子节点是顺序插入的话，二叉树就会变成一个线性的链表，这个时候和直接遍历数据没有区别，时间复杂度：O(n)；

这个时候我们思考一下，如果有一种平衡树，就可以提高效率，降低时间损耗，也就是下面的平衡二叉树（红黑树）；

红黑树

这个时候，时间复杂度就会一直为：O(log n);

但是我们还可以再思考一下，红黑树有没有问题呢？
肯定是有的，随着数据量的变大，树的高度会越来越高，我们查询的元素就越来越多，所以红黑树也是不行的；

我们继续思考，如果可以控制高度，是不是就解决了这个问题？
如果可以控制高度，将父节点的数据横向扩展，性能将会得到进一步的提升，这个时候B-Tree就登场了，其实我们的数据库索引就是基于B-Tree实现的；

B-Tree

B-Tree可以对树的每个节点做横向的扩展，既解决了链表问题，也保证树的高度不要太高，也就是每一个节点都存放索引和data，这种横向扩展的结构我们称做为页；

既然B-Tree这么完美，那为什么MySQL没有选择用B树做索引结构呢？
因为每个页里面都存放数据，带来了极大的IO开销，数据量如果很大，加载时内存损耗严重；

有什么办法可以解决吗？
如果我们只把数据存放在叶子节点上，父节点不存放数据，加载时根据父节点只加载某个叶子节点的数据，是不是就可以节省很多内存；B+Tree完全满足我们的想法；

B+Tree

B+Tree
B+Tree相较于B树有两个改变：

将数据只存在在叶子节点上（冗余），非叶子节点不存储data，这样可以存放更多的索引；
叶子节点包含所有的索引；
叶子节点用指针连接，提高区间访问的性能；

数据存在叶子节点的好处？
根节点和中间节点就能存储更多的索引数据；

叶子节点的横向指针的好处？
叶子节点的横向指针可以支持范围查询，比如我们要查询上图中索引大于4的数据，只需要获取指针右边的所有数据就行，非常方便；

Hash

将索引通过散列算法以后存储，精确查询可以快速定位到数据地址；
但是有一个很严重的问题，不支持范围查找，因为Hash运算以后的数据是没有顺序的，也不存在指针，所以无法进行范围查询；

主键索引和二级索引

主键索引：数据表的主键列使用的就是主键索引。一张数据表有只能有一个主键，并且主键不能为 null，不能重复。
二级索引：叶子节点存储的数据是主键的值，也就是说，通过二级索引可以定位主键的位置，二级索引又称为辅助索引/非主键索引。唯一索引，普通索引，前缀索引等索引都属于二级索引。

聚簇索引和非聚簇索引

聚簇索引：索引结构和数据一起存放的索引，并不是一种单独的索引类型。InnoDB 中的主键索引就属于聚簇索引。
非聚簇索引：索引结构和数据分开存放的索引，并不是一种单独的索引类型。二级索引(辅助索引)就属于非聚簇索引。MySQL 的 MyISAM 引擎，不管主键还是非主键，使用的都是非聚簇索引。非聚簇索引的叶子节点并不一定存放数据的指针，比如二级索引的叶子节点就存放的是主键，根据主键再回表查数据。