索引要点
哪些情况需要创建索引
- 主键自动建立唯一索引
- 频繁作为查询条件的字段应该创建索引
- 多表关联查询中,关联字段应该创建索引 on 两边都要创建索引
- 查询中排序的字段,应该创建索引
- 频繁查找字段 覆盖索引
- 查询中统计或者分组字段,应该创建索引 group by
哪些情况不需要创建索引
- 表记录太少
- 经常进行增删改操作的表
- 频繁更新的字段
- where条件里使用频率不高的字段
为什么使用组合索引
mysql创建组合索引的规则是首先会对组合索引的最左边的,也就是第一个name字段的数据进行排序,在第一个字段的排序基础上,然后再对后面第二个的cid字段进行排序。其实就相当于实现了类似 order by name cid这样一种排序规则。
为了节省mysql索引存储空间以及提升搜索性能,可建立组合索引(能使用组合索引就不使用单列索引)
例如:
创建组合索引(相当于建立了col1,col1 col2,col1 col2 col3三个索引):
ALTER TABLE 'table_name' ADD INDEX index_name('col1','col2','col3')
一颗索引树上创建3个索引 : 省空间
三颗索引树上分别创建1个索引 更容易实现覆盖索引
使用 遵循最左前缀原则
- 前缀索引 like a%
- 从左向右匹配直到遇到范围查询 > < between like
索引失效
查看执行计划
介绍
MySQL 提供了一个 EXPLAIN 命令, 它可以对 SELECT 语句的执行计划进行分析, 并输出 SELECT 执行的详细信息, 供开发人员针对性优化.
使用explain这个命令来查看一个这些SQL语句的执行计划,查看该SQL语句有没有使用上了索引,有没有做全表扫描,这都可以通过explain命令来查看。
可以通过explain命令深入了解MySQL的基于开销的优化器,还可以获得很多可能被优化器考虑到的访问策略的细 节,以及当运行SQL语句时哪种策略预计会被优化器采用。
EXPLAIN 命令用法十分简单, 在 SELECT 语句前加上 explain 就可以了, 例如:
参数说明
expain出来的信息有10列,分别是
id、select_type、table、type、possible_keys、key、key_len、ref、rows、Extra
案例表
--用户表
create table tuser(
id int primary key,
loginname varchar(100),
name varchar(100),
age int,
sex char(1),
dep int,
address varchar(100)
);
--部门表
create table tdep(
id int primary key,
name varchar(100)
);
--地址表
create table taddr(
id int primary key,
addr varchar(100)
);
--创建普通索引
mysql> alter table tuser add index idx_dep(dep);
--创建唯一索引
mysql> alter table tuser add unique index idx_loginname(loginname);
--创建组合索引
mysql> alter table tuser add index idx_name_age_sex(name,age,sex);
--创建全文索引
mysql> alter table taddr add fulltext ft_addr(addr);
id
- 每个 SELECT语句都会自动分配的一个唯一标识符.
- 表示查询中操作表的顺序,有三种情况:
- id相同:执行顺序由上到下
- id不同:如果是子查询,id号会自增,id越大,优先级越高。
- id相同的不同的同时存在
- id列为null的就表示这是一个结果集,不需要使用它来进行查询。
select_type(重要)
查询类型,主要用于区别普通查询、联合查询(union、union all)、子查询等复杂查询。
simple
表示不需要union操作或者不包含子查询的简单select查询。有连接查询时,外层的查询为simple,且只有一个
mysql> explain select * from tuser;
primary
一个需要union操作或者含有子查询的select,位于最外层的单位查询的select_type即为primary。且只有一个
mysql> explain select (select name from tuser) from tuser ;
subquery
除了from字句中包含的子查询外,其他地方出现的子查询都可能是subquery
mysql> explain select * from tuser where id = (select max(id) from tuser);
dependent subquery
与dependent union类似,表示这个subquery的查询要受到外部表查询的影响
mysql> explain select id,name,(select name from tdep a where a.id=b.dep) from tuser b;
union
union连接的两个select查询,第一个查询是PRIMARY,除了第一个表外,第二个以后的表select_type都是union
mysql> explain select * from tuser where sex='1' union select * from tuser where sex='2';
dependent union
与union一样,出现在union 或union all语句中,但是这个查询要受到外部查询的影响
mysql> explain select * from tuser where sex in (select sex from tuser where sex='1' union select sex from tuser where sex='2');
union result
包含union的结果集,在union和union all语句中,因为它不需要参与查询,所以id字段为null
derived
from字句中出现的子查询,也叫做派生表,其他数据库中可能叫做内联视图或嵌套select
mysql> explain select * from (select * from tuser where sex='1') b;
table
- 显示的查询表名,如果查询使用了别名,那么这里显示的是别名
- 如果不涉及对数据表的操作,那么这显示为null
- 如果显示为尖括号括起来的就表示这个是临时表,后边的N就是执行计划中的id,表示结果来自于这个查询产生。
- 如果是尖括号括起来的<union M,N>,与类似,也是一个临时表,表示这个结果来自于union查询的id为M,N的 结果集。
type(重要)
- 依次从好到差:
system,const,eq_ref,ref,fulltext,ref_or_null,unique_subquery,index_subquery,range,
index_merge,index,ALL
除了all之外,其他的type都可以使用到索引,除了index_merge之外,其他的type只可以用到一个索引
- 注意事项:
最少要索引使用到range级别。
system
表中只有一行数据或者是空表。
mysql> explain select * from tuser where id=1;;
const(重要)
使用唯一索引或者主键,返回记录一定是1行记录的等值where条件时,通常type是const。其他数据库也叫做唯一索引扫描
mysql> explain select * from tuser where id=1;
eq_ref(重要)
关键字:连接字段主键或者唯一性索引。
此类型通常出现在多表的 join 查询, 表示对于前表的每一个结果, 都只能匹配到后表的一行结果. 并且查询的比较操作
通常是 ‘=’, 查询效率较高.
mysql> explain select a.id from tuser a left join tdep b on a.dep=b.id;
ref(重要)
针对非唯一性索引,使用等值(=)查询非主键。或者是使用了最左前缀规则索引的查询。
--非唯一索引
mysql> explain select * from tuser where dep=1;
--等值非主键连接
mysql> explain select a.id from tuser a left join tdep b on a.name=b.name;
--最左前缀
mysql> explain select * from tuser where name = 'zhaoyun';
fulltext
全文索引检索,要注意,全文索引的优先级很高,若全文索引和普通索引同时存在时,mysql不管代价,优先选择使 用全文索引
mysql> explain select * from taddr where match(addr) against('bei');
ref_or_null
与ref方法类似,只是增加了null值的比较。实际用的不多。
unique_subquery
用于where中的in形式子查询,子查询返回不重复值唯一值
index_subquery
用于in形式子查询使用到了辅助索引或者in常数列表,子查询可能返回重复值,可以使用索引将子查询去重。
range(重要)
索引范围扫描,常见于使用>,<,is null,between ,in ,like等运算符的查询中。
mysql> explain select id from tuser where id>1;
index_merge
表示查询使用了两个以上的索引,最后取交集或者并集,常见and ,or的条件使用了不同的索引,官方排序这个在ref_or_null之后,但是实际上由于要读取所个索引,性能可能大部分时间都不如range
index(重要)
关键字:条件是出现在索引树中的节点的。可能没有完全匹配索引。
索引全表扫描,把索引从头到尾扫一遍,常见于使用索引列就可以处理不需要读取数据文件的查询、可以使用索引排序或者分组的查询。
mysql> explain select loginname from tuser;
all(重要)
这个就是全表扫描数据文件,然后再在server层进行过滤返回符合要求的记录。
mysql> explain select * from tuser;
possible_keys
此次查询中可能选用的索引,一个或多个 key 查询真正使用到的索引,select_type为index_merge时,这里可能出现两个以上的索引,其他的select_type这里只会出现一个。
key_len
- 用于处理查询的索引长度,如果是单列索引,那就整个索引长度算进去,如果是多列索引,那么查询不一定都 能使用到所有的列,具体使用到了多少个列的索引,这里就会计算进去,没有使用到的列,这里不会计算进去。
- 留意下这个列的值,算一下你的多列索引总长度就知道有没有使用到所有的列了。
- 另外,key_len只计算where条件用到的索引长度,而排序和分组就算用到了索引,也不会计算到key_len中。
ref
- 如果是使用的常数等值查询,这里会显示const
- 如果是连接查询,被驱动表的执行计划这里会显示驱动表的关联字段
- 如果是条件使用了表达式或者函数,或者条件列发生了内部隐式转换,这里可能显示为func
extra(重要)
这个列包含不适合在其他列中显示单十分重要的额外的信息,这个列可以显示的信息非常多,有几十种,常用的有
rows
这里是执行计划中估算的扫描行数,不是精确值(InnoDB不是精确的值,MyISAM是精确的值,主要原因是InnoDB里面使用了MVCC并发机制)
extra(重要)
这个列包含不适合在其他列中显示单十分重要的额外的信息,这个列可以显示的信息非常多,有几十种,常用的有
distinct
在select部分使用了distinct关键字
no tables used
不带from字句的查询或者From dual查询
使用not in()形式子查询或not exists运算符的连接查询,这种叫做反连接
即,一般连接查询是先查询内表,再查询外表,反连接就是先查询外表,再查询内表。
using filesort(重要)
排序时无法使用到索引时,就会出现这个。常见于order by和group by语句中
说明MySQL会使用一个外部的索引排序,而不是按照索引顺序进行读取。
MySQL中无法利用索引完成的排序操作称为“文件排序”
mysql> explain select * from tuser order by address;
using index(重要)
查询时不需要回表查询,直接通过索引就可以获取查询的数据。
- 表示相应的SELECT查询中使用到了覆盖索引(Covering Index),避免访问表的数据行,效率不错!
- 如果同时出现Using Where ,说明索引被用来执行查找索引键值
- 如果没有同时出现Using Where ,表明索引用来读取数据而非执行查找动作。
mysql> explain select * from tuser order by address;
using join buffer(block nested loop),using join buffer(batched key accss)
5.6.x之后的版本优化关联查询的BNL,BKA特性。主要是减少内表的循环数量以及比较顺序地扫描查询。
using sort_union,using_union,using intersect,using sort_intersection
- using intersect:表示使用and的各个索引的条件时,该信息表示是从处理结果获取交集
- using union:表示使用or连接各个使用索引的条件时,该信息表示从处理结果获取并集
- using sort_union和using sort_intersection:与前面两个对应的类似,只是他们是出现在用and和or查询信息 量大时,先查询主键,然后进行排序合并后,才能读取记录并返回。
using temporary
表示使用了临时表存储中间结果。
MySQL在对查询结果order by和group by时使用临时表 临时表可以是内存临时表和磁盘临时表,执行计划中看不出来,需要查看status变量,used_tmp_table, used_tmp_disk_table才能看出来。
using where(重要)
表示存储引擎返回的记录并不是所有的都满足查询条件,需要在server层进行过滤。
–查询条件无索引
mysql> explain select * from tuser where address='beijing';
–索引失效
mysql> explain select * from tuser where age=1;
using index condition
查询条件中分为限制条件和检查条件,5.6之前,存储引擎只能根据限制条件扫描数据并返回,然后server层根
据检查条件进行过滤再返回真正符合查询的数据。5.6.x之后支持ICP特性,可以把检查条件也下推到存储引擎 层,不符合检查条件和限制条件的数据,直接不读取,这样就大大减少了存储引擎扫描的记录数量。extra列显 示using index condition
firstmatch(tb_name)
5.6.x开始引入的优化子查询的新特性之一,常见于where字句含有in()类型的子查询。如果内表的数据量比较大,就 可能出现这个
loosescan(m…n)
5.6.x之后引入的优化子查询的新特性之一,在in()类型的子查询中,子查询返回的可能有重复记录时,就可能出现这 个
除了这些之外,还有很多查询数据字典库,执行计划过程中就发现不可能存在结果的一些提示信息
filtered
使用explain extended时会出现这个列,5.7之后的版本默认就有这个字段,不需要使用explain
extended了。这个字段表示存储引擎返回的数据在server层过滤后,剩下多少满足查询的记录数量的比例,注意是百分比,不是具体记 录数。
参考网站
https://segmentfault.com/a/1190000008131735
https://blog.csdn.net/rewiner120/article/details/70598797
索引失效分析
最佳左前缀法则
组合索引
带头索引不能死,中间索引不能断
如果索引了多个列,要遵守最佳左前缀法则。指的是查询从索引的最左前列开始 并且不跳过索引中的列。
不要在索引上做计算
不要进行这些操作:计算、函数、自动/手动类型转换,不然会导致索引失效而转向全表扫描
范围条件右边的列失效
不能继续使用索引中范围条件(bettween、<、>、in等)右边的列
尽量使用覆盖索引
尽量使用覆盖索引(只查询索引的列),也就是索引列和查询列一致,减少select *
索引字段上不要使用不等
索引字段上使用(!= 或者 < >)判断时,会导致索引失效而转向全表扫描
主键索引字段上不可以判断null
主键字段上不可以使用 null
索引字段上使用 is null / is not null 判断时,可使用索引
索引字段使用like不以通配符开头
索引字段使用like以通配符开头(‘%字符串’)时,会导致索引失效而转向全表扫描
索引字段字符串要加单引号
索引字段是字符串,但查询时不加单引号,会导致索引失效而转向全表扫描
索引字段不要使用or
索引字段使用 or 时,会导致索引失效而转向全表扫描