6-Mysql-索引匹配和失效及相关优化

最新推荐文章于 2024-07-12 10:15:00 发布

小崔侃大山

最新推荐文章于 2024-07-12 10:15:00 发布

阅读量243

点赞数 1

分类专栏： Mysql 文章标签： mysql 索引数据库 mysql优化 java

本文链接：https://blog.csdn.net/weixin_42985717/article/details/113201827

版权

Mysql 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

本文知识点来源于网络，仅限学习笔记使用，记录学习过程与心得，如有不适，请联系。

本文涉及explain多个属性值，如果对其不明确，请先参考
Explain简介

一、索引全值匹配（best）

#创建复合索引

#创建复合索引
CREATE INDEX idx_depId_name_age ON employee(dep_id,name,age);
#使用复合索引中全部的字段
EXPLAIN SELECT * FROM employee WHERE dep_id = 1 AND name = '张三' AND age=10;

查看执行计划，复合索引中的字段都用上了，这是最好的情况：

在这里插入图片描述

二、最佳左前缀法则

使用复合索引，要遵从最左前缀法则，即从索引的左列开始，并且不跳过（不使用）索引中的列。
接上边的例子，下边展示不同情况索引失效：

不使用第一个，索引失效

#不使用第一个，索引失效
EXPLAIN SELECT * FROM employee WHERE name = '张三' AND age=10;

索引失效，没有使用索引
在这里插入图片描述
2. 不使用前两个，索引失效

#不使用前两个，索引失效
EXPLAIN SELECT * FROM employee WHERE age=10;

在这里插入图片描述
3. 不使用中间的，只有第一个索引生效

#不使用中间的，只有第一个索引生效
EXPLAIN SELECT * FROM employee WHERE dep_id = 1 AND age=10;

在这里插入图片描述
4. 不使用最后一个，前两个索引生效

#不使用最后一个，前两个索引生效
EXPLAIN SELECT * FROM employee WHERE dep_id = 1 AND name = '张三'

在这里插入图片描述

不使用最后两个，第一个生效

#不使用最后两个，第一个生效
EXPLAIN SELECT * FROM employee WHERE dep_id = 1;

在这里插入图片描述

如果创建索引的三个列都使用，就是索引全值匹配，这三个列的顺序可以颠倒，但一定要有
例如：现在创建索引时顺序为dep_id,name,age

#与顺序无关
EXPLAIN SELECT * FROM employee WHERE age=10  AND dep_id = 1 AND name = '张三';

在这里插入图片描述

三、函数计算引起索引失效

不要在索引字段上加上计算，函数，类型转换，会导致索引失效转向全表扫描。
例1：在第二个索引列上加上trim()函数，导致第二个，第三个索引失效，只有第一个索引生效

#函数计算引起索引失效
EXPLAIN SELECT * FROM employee WHERE dep_id = 1 AND trim(name) = '张三' AND age=10;

在这里插入图片描述
例2：在第三个索引列age做计算操作，导致只有前两个索引生效

#函数计算引起索引失效
EXPLAIN SELECT * FROM employee WHERE dep_id = 1 AND name = '张三' AND age/2 =10;

在这里插入图片描述

四、范围条件右边的索引失效（范围条件列索引不会失效）

与查询顺序无关，与创建顺序有关
由上边举例我们可以总结道按索引创建顺序 dep_id,name,age，当我们三个索引都用到的情况下key_len 为73

#与查询顺序无关，与创建顺序有关
EXPLAIN SELECT * FROM employee WHERE dep_id = 5 AND age>10 AND name = '张三';

在这里插入图片描述

五、使用不等于（！=或<>）索引失效

#使用不等于（！=或<>）索引失效
EXPLAIN SELECT * FROM employee WHERE dep_id != 1;

在这里插入图片描述

#使用不等于（！=或<>）索引失效
EXPLAIN SELECT * FROM employee WHERE dep_id <> 1;

在这里插入图片描述

六、使用is not null 索引失效

#使用is not null 索引失效
EXPLAIN SELECT * FROM employee WHERE dep_id is not NULL;

在这里插入图片描述

EXPLAIN SELECT * FROM employee WHERE dep_id = 1 AND name is not null AND age=10;

在这里插入图片描述
注意：is null 看结果

EXPLAIN SELECT * FROM employee WHERE dep_id = 1 AND name is null AND age=10;

在这里插入图片描述

七、用or连接时索引失效

EXPLAIN SELECT * FROM employee WHERE dep_id = 1 or name = '张三';

在这里插入图片描述

八、like以通配符（%）开头索引失效

例1：like模糊查询以%开头，造成只有dep_id索引生效，name没有生效

#like以通配符（%）开头索引失效
EXPLAIN SELECT * FROM employee WHERE dep_id = 1 AND name LIKE '%三';

在这里插入图片描述

例2：like模糊查询不以%开头，两个索引都生效

EXPLAIN SELECT * FROM employee WHERE dep_id = 1 AND name LIKE '三%';

在这里插入图片描述

九、字符串不加单引号造成索引失效

首先加单引号：

EXPLAIN SELECT * FROM employee WHERE dep_id = 1 AND name = '200';

在这里插入图片描述
对比不加单引号

#字符串不加单引号造成索引失效
EXPLAIN SELECT * FROM employee WHERE dep_id = 1 AND name = 200;

在这里插入图片描述

十、尽量使用覆盖索引少用select *

即查询的字段和建立索引的字段刚好吻合，称为覆盖索引。
如上述第五条：使用不等于（！=或<>）索引失效，我们不用select * 用select dep_id

EXPLAIN SELECT dep_id FROM employee WHERE dep_id <> 1;

使用了索引
在这里插入图片描述
注意这样写只是尽可能的优化，并不是只要使用了覆盖索引就一定能保证使用全部的索引字段
如下，字符串没有加单引号，虽然使用了索引，单只使用了一个索引字段dep_id,和select * 效果是一样的：

EXPLAIN SELECT dep_id,name,age FROM employee WHERE dep_id = 1 AND name = 200 and age = 10;

在这里插入图片描述

十一、order by与group by相关

11.1在使用order by时，经常出现Using filesort（使用文件排序，即无法利用索引完成排序操作）。以下有几种情况，我们一一介绍：、

order by后边的字段没有按照创建索引的顺序排序时，会出现Using filesort，例我们创建索引的顺序：

#先演示正确情况
EXPLAIN SELECT dep_id,name,age FROM employee ORDER BY dep_id, name, age;

在这里插入图片描述

#order by后边的字段没有按照创建索引的顺序排序时，会出现Using filesort
EXPLAIN SELECT dep_id,name,age FROM employee ORDER BY name,dep_id, age;

在这里插入图片描述

依然是最左匹配，但是单反少左边任何一个都会导致Using filesort
如：

#不会Using filesort
EXPLAIN SELECT dep_id,name,age FROM employee ORDER BY dep_id, name, age;
#不会Using filesort
EXPLAIN SELECT dep_id,name,age FROM employee ORDER BY dep_id, name;
#会Using filesort
EXPLAIN SELECT dep_id,name,age FROM employee ORDER BY name, age;
#会Using filesort
EXPLAIN SELECT dep_id,name,age FROM employee ORDER BY dep_id,age;

当使用*时会，所以尽量使用覆盖索引

#不会Using filesort
EXPLAIN SELECT dep_id,name,age FROM employee ORDER BY dep_id, name, age;
#会Using filesort
EXPLAIN SELECT * FROM employee ORDER BY dep_id, name, age;

当索引字段是常量时不会出现Using filesort

#为常量
EXPLAIN SELECT dep_id,name,age FROM employee WHERE dep_id = 1 ORDER BY name, age;

在这里插入图片描述
作为比较:

#不为常量
EXPLAIN SELECT dep_id,name,age FROM employee WHERE dep_id > 1 ORDER BY name, age;

在这里插入图片描述

同时使用一升序一降序，会出现Using filesort

#同时使用一升序一降序，会出现Using filesort
EXPLAIN SELECT dep_id,name,age FROM employee WHERE dep_id > 1 ORDER BY name DESC , age ASC;

在这里插入图片描述

11.2 在使用group by时，使用不当，也会出现Using temporary（使用临时表）的情况。

情况同11.1，因为分组前必排序

十二、大批量数据分页操作如何优化

测试前我删除了employee 表复合索引

#格式
SELECT * FROM employee LIMIT [offset,]rows;
#例子
SELECT * FROM employee LIMIT 100000,5;

在这里插入图片描述

随着offset增大，查询的速度会越来越慢，原因是mysql做分页的时候会把offset前边的数据都取出来，找到对应位置。

根据执行过程有如下优化思路：

让其最费时的"找到对应位置"这段走索引
分析原分页语句执行过程，发现其并没有使用索引

我们让其使用索引，改造，并分析执行过程：

EXPLAIN SELECT id FROM employee LIMIT 100000,5;

在这里插入图片描述

通过内连接拿到我们的目标数据

SELECT * FROM employee e INNER JOIN (SELECT t.id FROM employee t LIMIT 100000,5) temp ON e.id = temp.id;

在这里插入图片描述
2.原理同1，但sql不同

SELECT * FROM employee e WHERE e.id >= (SELECT t.id FROM employee t LIMIT 100000,1) LIMIT 5;

在这里插入图片描述

直接上sql

#原始
SELECT * FROM employee LIMIT 100000,5;
#改造
SELECT * FROM employee WHERE id > 100000 LIMIT 5;

思路如上，但是你要保证id是自增的，还有先排序，在分页，否则limit没有意义，可能会出现你上下两条sql查询的记录不一样

十三、最大值max优化

例：查询employee表age的最大值（测试前我删除该表复合索引）

#我们传统写法
EXPLAIN SELECT MAX(age) FROM employee;

在这里插入图片描述

方法，加索引就是淦

#给age添加索引
CREATE INDEX idx_age ON employee(age);
#查询执行计划
EXPLAIN SELECT MAX(age) FROM employee;

在这里插入图片描述

由执行计划看出：Select tables optimized away
SELECT操作已经优化到不能再优化了（MySQL根本没有遍历表或索引，通过优化器统计信息中直接返回数据了）。

十四、使用count统计信息

准备数据

SELECT * FROM department;

一共6条数据：
在这里插入图片描述

count(*)统计所有，包含null

SELECT COUNT(*) FROM department;

在这里插入图片描述

count(字段)统计所有，不包含null

SELECT COUNT(deptName) FROM department;

在这里插入图片描述

扩展

SELECT COUNT(*) FROM department;
#等价于
SELECT COUNT(deptName OR deptName IS NULL) FROM department;

在这里插入图片描述

十五、in 或 exist的抉择

#小表驱动大表，先执行子查询
SELECT * FROM employee e WHERE e.dep_id IN(SELECT id FROM department);

#大表驱动小表，先执行主查询
SELECT * FROM employee e WHERE EXISTS(SELECT 2 FROM department d WHERE e.dep_id = d.id);

相当于双层for循环，我们抽象来看：

for(外层循环相当于数据连接数，费资源，当然越小越好){
	for(内循环表示每次数据库连接做多少次==判断) {
		if( == 判断)
	}
}

总结A表（employee ），B表（department ）：

当A表数据多余B表数据时，用IN优于EXISTS；
当A表数据少于B表数据时，用EXISTS优于IN；
数据量差不多是，差别不大。

小崔侃大山

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

6-Mysql-索引匹配和失效及相关优化

一、索引全值匹配（best）

二、最佳左前缀法则

三、函数计算引起索引失效

四、范围条件右边的索引失效（范围条件列索引不会失效）

五 、使用不等于（！=或<>）索引失效

六、使用is not null 索引失效

七、用or连接时索引失效

八、like以通配符（%）开头索引失效

九、字符串不加单引号造成索引失效

十、尽量使用覆盖索引少用select *

十一、order by与group by相关

11.1在使用order by时，经常出现Using filesort（使用文件排序，即无法利用索引完成排序操作）。以下有几种情况，我们一一介绍：、

11.2 在使用group by时，使用不当，也会出现Using temporary（使用临时表）的情况。

十二、大批量数据分页操作如何优化

十三、最大值max优化

十四、 使用count统计信息

十五、in 或 exist的抉择

五、使用不等于（！=或<>）索引失效

十四、使用count统计信息