mysql高级 ---索引（需要基本数据结构知识）

最新推荐文章于 2024-07-13 16:00:03 发布

杨佳锡

最新推荐文章于 2024-07-13 16:00:03 发布

阅读量260

点赞数

文章标签：数据结构

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Asd12snd/article/details/126228655

版权

一索引（提高查询速度主要在于索引）

索引（ index ）是帮助 MySQL 高效获取数据的数据结构 ( 有序 ) 。在数据之外，数据库系统还维护着满足特定查找算法的数据结构，这些数据结构以某种方式引用（指向）数据，这样就可以在这些数据结构上实现高级查找算法，这种数据结构就是索引。

这里有一张表：

假如我们要执行的SQL语句为： select * from user where age = 45;

1）无索引情况

查询效率很低，要索全表

2）有索引

当我们有索引时就能快速锁定目标，提高检索效率（尤其是数据量十分庞大的时候）

二索引结构

二叉树：

假如MySql的索引结构采用二叉树的数据结构：

（可能会出现以下的情况：）

如果主键是顺序插入的，则会出现单向链表：

所以如果采用二叉树为索引结构，会存在以下缺点：

（1）顺序插入时，会形成一个链表，查询性能大大降低。

（2）大数据量情况下，层级较深，检索速度慢。

那么红黑树（平衡二叉树）呢？

红黑树也会存在一个缺点：

（1）大数据量的情况下，层级较深，检索速度慢

所以，在 MySQL 的索引结构中，并没有选择二叉树或者红黑树，而选择的是 B+Tree ，那么什么是

B+Tree 呢？在详解 B+Tree 之前，先来介绍一个 B-Tree 。

B-Tree ， B 树是一种多叉路衡查找树，相对于二叉树， B 树每个节点可以有多个分支，即多叉。

以一颗最大度数（ max-degree ）为 5(5 阶 ) 的 b-tree 为例，那这个 B 树每个节点最多存储 4 个 key ， 5

个指针：

特点：（向上分裂，向下繁殖）

5 阶的 B 树，每一个节点最多存储 4 个 key ，对应 5 个指针。

一旦节点存储的 key 数量到达 5 ，就会裂变，中间元素向上分裂。

在 B 树中，非叶子节点和叶子节点都会存放数据。

B+Tree

我们可以看到，两部分：

绿色框框起来的部分，是索引部分，仅仅起到索引数据的作用，不存储数据。

红色框框起来的部分，是数据存储部分，在其叶子节点中要存储具体的数据。

最终我们看到， B+Tree 与 B-Tree 相比，主要有以下三点区别：

所有的数据都会出现在叶子节点。

叶子节点形成一个单向链表。

非叶子节点仅仅起到索引数据作用，具体的数据都是在叶子节点存放的。

上述我们所看到的结构是标准的 B+Tree 的数据结构，接下来，我们再来看看 MySQL 中优化之后的

B+Tree 。

MySQL 索引数据结构对经典的 B+Tree 进行了优化。在原 B+Tree 的基础上，增加一个指向相邻叶子节点

的链表指针，就形成了带有顺序指针的 B+Tree ，提高区间访问的性能，利于排序。

表空间 : InnoDB 存储引擎逻辑结构的最高层， ibd 文件其实就是表空间文件，在表空间中可以

包含多个 Segment 段。

段 : 表空间是由各个段组成的，常见的段有数据段、索引段、回滚段等。 InnoDB 中对于段的管

理，都是引擎自身完成，不需要人为对其控制，一个段中包含多个区。

区 : 区是表空间的单元结构，每个区的大小为 1M 。默认情况下， InnoDB 存储引擎页大小为

16K ，即一个区中一共有 64 个连续的页。

页 : 页是组成区的最小单元， 页也是 InnoDB 存储引擎磁盘管理的最小单元 ，每个页的大小默

认为 16KB 。为了保证页的连续性， InnoDB 存储引擎每次从磁盘申请 4-5 个区。

行 : InnoDB 存储引擎是面向行的，也就是说数据是按行进行存放的，在每一行中除了定义表时

所指定的字段以外，还包含两个隐藏字段

三 Hash

MySQL 中除了支持 B+Tree 索引，还支持一种索引类型 ---Hash 索引。

1). 结构

哈希索引就是采用一定的 hash 算法，将键值换算成新的 hash 值，映射到对应的槽位上，然后存储在 hash表中。

如果两个 ( 或多个 ) 键值，映射到一个相同的槽位上，他们就产生了 hash 冲突（也称为 hash 碰撞），可以通过链表来解决。

特点

A. Hash 索引只能用于对等比较 (= ， in) ，不支持范围查询（ between ， > ， < ， ... ）

B. 无法利用索引完成排序操作

C. 查询效率高，通常 ( 不存在 hash 冲突的情况 ) 只需要一次检索就可以了，效率通常要高于 B+tree 索

引

3). 存储引擎支持

在 MySQL 中，支持 hash 索引的是 Memory 存储引擎。而 InnoDB 中具有自适应 hash 功能， hash 索引是

InnoDB 存储引擎根据 B+Tree 索引在指定条件下自动构建的。

总结：

mysql中索引的数据结构为什么是B+Tree（重要）

选择二叉树：如果数据量过多，会有层高问题，也会有形成单链表的情况，造成查询速度变慢；

选择红黑树：也会出现层高问题；B树：如果存储的数据的过大，比如说存一个视频或是图片的话，一个节点可能会存不了这么多的数据，也会出现层高问题；B+树：只有在叶子节点才会存储数据信息，避免出现层高问题。

不选择hash表：hash表不能用于范围查询；当出现hash碰撞时会导致查询速度变慢

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
mysql高级 ---索引（需要基本数据结构知识）

查询优化，mysql高级，索引数据结构
复制链接

扫一扫

杨佳锡 CSDN认证博客专家 CSDN认证企业博客

码龄4年

30: 原创

48万+: 周排名

97万+: 总排名

4865: 访问

: 等级

300: 积分

1: 粉丝

0: 获赞

1: 评论

3: 收藏

私信

关注

热门文章

最新评论

Java新特性
CSDN-Ada助手: 推荐 Java 技能树：https://edu.csdn.net/skill/java?utm_source=AI_act_java

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。