Mysql 索引快速扫盲

最新推荐文章于 2024-09-06 23:32:02 发布

Kendrick_Wzx

最新推荐文章于 2024-09-06 23:32:02 发布

阅读量645

点赞数 26

分类专栏： mysql 文章标签： mysql 数据库

本文链接：https://blog.csdn.net/qq_41699731/article/details/139928049

版权

mysql 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

文章目录

Mysql 索引

Mysql 索引

介绍

索引是一种用于快速查询和检索数据的数据结构，其本质可以看成一个排列好的数据结构。

优缺点

优点：

大大加快数据的检索数独（减少检索的数据量），减少 IO 次数，最主要的原因
通过创建唯一性索引，可以保证数据库中每一行数据的唯一性

缺点：

创建索引和维护索引需要耗费许多时间，当对表中的数据进行增删改的时候，如果没有索引，那么索引也需要动态的修改，会降低 SQL 执行效率
索引需要使用物理文件存储，也会耗费一定空间

但是，使用索引一定能提高查询效率吗？

大多数情况下，索引查询都是比全表扫描要快的。但是如果数据库的数据量不大，那么使用索引也不一定能够带来很大提升。

B 树& B+树

B 树也称 B-树,全称为 多路平衡查找树 ，B+ 树是 B 树的一种变体。B 树和 B+树中的 B 是 Balanced （平衡）的意思。

目前大部分数据库系统及文件系统都采用 B-Tree 或其变种 B+Tree 作为索引结构。

B 树& B+树两者有何异同呢？

B 树的所有节点既存放键(key) 也存放数据(data)，而 B+树只有叶子节点存放 key 和 data，其他内节点只存放 key。
B 树的叶子节点都是独立的;B+树的叶子节点有一条引用链指向与它相邻的叶子节点。
B 树的检索的过程相当于对范围内的每个节点的关键字做二分查找，可能还没有到达叶子节点，检索就结束了。而 B+树的检索效率就很稳定了，任何查找都是从根节点到叶子节点的过程，叶子节点的顺序检索很明显。
在 B 树中进行范围查询时，首先找到要查找的下限，然后对 B 树进行中序遍历，直到找到查找的上限；而 B+树的范围查询，只需要对链表进行遍历即可。

综上，B+树与 B 树相比，具备更少的 IO 次数、更稳定的查询效率和更适于范围查询这些优势。

选择合适的字段创建索引

不为 null 的字段：较难优化数据为 NULL 的字段，建议改成 0,1，true，false 寓意清晰的数据
被频繁查询的字段
被作为条件查询的字段
频繁需要排序的字段：加快排序的时间
被经常频繁用于连接的字段：提高多表连接查询的效率

被频繁更新的字段应该慎重建立索引

维护索引的成本是不小的，需要重新建立排序

限制每张表上的索引数量

建议单表索引不超过5个！！！

索引可以提高效率同样也可以降低效率

尽可能的考虑建立联合索引而不是单列索引

因为索引是需要占用磁盘空间的，可以简单理解为每个索引都对应着一颗B+树。如果一个表的字段过多，索引过多，那么当这个表的数据达到一个体量后，索引占用的空间也是很多的，且修改索引时，耗费的时间也是较多的，如果是联合索引，多个字段在一个索引上，那么将会节约很大的磁盘空间，且修改数据的操作效率也会提升。

注意避免冗余索引

冗余索引指的是索引功能相同，能够命中索引（a，b）就肯定能命中索引 a，那么索引 a 就是冗余索引。

避免索引失效

创建了组合索引，单查询条件为遵守最左匹配原则
在索引上进行计算，函数，类型转换等操作
也 % 开头的 LIKE 查询
查询条件中使用 OR，且 OR 的前后条件中有一个列没有索引，涉及的索引都不会被使用到
is null 可以使用索引，但是 is not null 无法使用索引

删除长期未使用的索引

删除长期未使用的索引，不用的索引的存在会造成不必要的性能损耗。

MySQL 5.7 可以通过查询 sys 库的 schema_unused_indexes 视图来查询哪些索引从未被使用。

EXPLAIN

各个字段的含义如下：

列名	含义
id	SELECT 查询的序列标识符
select_type	SELECT 关键字对应的查询类型
table	用到的表名
partitions	匹配的分区，对于未分区的表，值为 NULL
type	表的访问方法
possible_keys	可能用到的索引
key	实际用到的索引
key_len	所选索引的长度
ref	当使用索引等值查询时，与索引作比较的列或常量
rows	预计要读取的行数
filtered	按表条件过滤后，留存的记录数的百分比
Extra	附加信息

id

select查询的序列号，表示查询中执行select子句或操作表的顺序
id相同时，执行顺序由上至下
id不同，如果是子查询，id的序号会递增，id值越大优先级越高，则先被执行
id相同和不同都存在是，id相同的可以理解为一组，从上往下顺序执行，所有组中，id值越大，优先级越高越先执行。

select_type

simple：简单的select查询，查询中不包含子查询或者union
primary：查询中若包含任何复杂的子部分，最外层查询则被标记为primary
derived：在from列表中包含的子查询被标记为derived（衍生），mysql会递归执行这些子查询，把结果放在临时表里。
subquery：在select或where列表中包含了子查询。
table：显示这一行的数据是关于哪张表的