1. 索引概述
- 索引是帮助MySQL高效获取数据的有序的数据结构。
- 数据库系统同时维护着原始数据和满足特定查找算法的数据结构,这些数据结构以某种方式引用数据,这样就可以在这些数据结构上实现高级查找算法,这种数据结构就是索引。
示例:
依次遍历时间复杂度会很高
1. 索引结构
- MySQL的索引是在存储引擎层实现的,不同的存储引擎有不同的结构。
1.1 索引结构分析
- 二叉树 & 红黑树
- B树
- B+树
- Hash
1.2 实际应用中的索引结构
1.3 为什么InnoDB存储引擎选择使用B+树索引结构?
- 相对于二叉树,层级更少,搜索效率高
- 对于B树,无论是叶子节点还是非叶子节点,都会保留数据,这样导致一页中存储的键值减少,指针跟着减少,要同样保存大量数据,只能增加树的高度,导致性能降低。
- 相对于Hash索引,B+树支持范围匹配及排序操作。
3. 索引的分类
以下SQL语句哪个执行效率高?
selsect * from user where id = 10;
select * from user where name =‘Arm’;
// id 为主键,name字段创建的有索引;
- 根据 id 查找:
- 根据 name 查找
需要进行回表查询。
4. 索引语法
- 示例:
- 准备一张表
- 查看表中的索引:
- 为name字段创建索引:
create index idx_user_name on tb_user(name);- 为phone字段创建唯一索引:
create unique index idx_user_phone on tb_user(phone);- 为profession、age、status创建联合索引
create index_idx_user_pro_age_sta on tb_user(profession、age、status);- 为email建立合适的索引来提升查询效率:
create index idx_user_email on tb_user(email);- 删除email的索引:
drop index idx_user_email on tb_user;
5. SQL性能分析
5.1 SQL执行频率
MySQL客户端连接成功后,通过 show [session] [global] status 命令可以提供服务器状态信息,查看当前数据库的 insert、update、delete、select的访问频次;
show global status like ‘Com_____’;
5.2 慢查询日志
- 慢查询日志记录了所有执行时间超过指定参数(long_query_time,单位:秒,默认10秒)的所有SQL语句的日志。
- 查看慢查询日志是否开启:
show varialbes like ‘slow_query_log’ ;
- MySQL的慢查询日志默认没有开启,需要在MySQL的配置文件(/etc/my.cnf)中配置如下信息:
- 查看实时慢查询日志输出的内容:
tail -f localhost-slow.log
5.3 profile 详情
- show profiles 能够在做SQL优化时帮助我们了解时间都耗费到哪里去了,通过hava_profiling参数能够看到当前MySQL是否支持profile操作:
select @@hava_profiling;
- profiling是关闭的,可以通过set语句在session/global级别开启profiling:
set profiling = 1;
5.4 explain 执行计划
- explain或者desc命令获取MySQL如何执行select语句的信息,包括在select语句执行过程中表如何连接和连接的顺序:
- 语法:
在任意的语句前加上 explain或者desc
- id:
select 查询的序列号,表示查询中执行select子句或者是操作表的顺序(id相同,执行顺序从上到下,id不同,值越大越先执行);- select_type:
表示select的类型,常见的取值有semple,primary,union,subquery等;- type:
表示连接类型,性能由好到差的连接类型为:NULL,system,const,eq_ref,ref,range,index,all;- possible_key:
显示可能应用在这张表上的索引,一个或多个;- key:
实际使用的索引,如果为null则没有使用索引- key_len:
表示索引中使用的字节数,该值为索引字段最大可能长度,并非实际使用长度,在不损失精确性的前提下,长度越短越好;- rows:
MySQL认为必须要执行查询的行数(预估值),在innodb引擎的表中,可能并不是准确的。- filtered:
表示返回结果的行数占需读取行数的百分比,filtered的值越大越好。
6. 索引的使用
6.1 最左前缀法则
- 如果索引了多列(联合索引)要遵守最左前缀法则。查询从索引的最左列开始,并且不跳过索引中的列,如果跳跃某一列,索引将部分失效(后面的字段索引失效);
6.2 范围查询
- 联合索引中,出现范围查询(>,<),范围查询右侧的列索引失效。
6.3 索引列运算
- 不要在索引列上进行运算操作,索引将失效。
6.4 字符串不加引号
- 字符串类型字段使用时不加引号索引将失效。
6.5 模糊查询
- 仅尾部模糊匹配索引不会失效,如果是头部模糊匹配索引失效。
6.6 or连接的条件
- 用or分隔开的条件中的列有索引,而后面的列中没有索引,那么涉及的索引都不会被用到。
6.7 数据分布影响
- 如果MySQL评估使用索引比全表更慢,则不使用索引。
6.8 SQL提示
- 在SQL语句中加入一些人为的提示来达到优化操作的目的,是优化数据库的一个重要手段
- use index:
- ignore index:
- force index:
6.9 覆盖索引
- 尽量使用覆盖索引(查询使用了索引,并且需要返回的列,在该索引中已经全部能够找到),减少 select * ;
6.10 前缀索引
- 当字段类型为字符串(varchar,text等)时,有时候选哟索引很长的字符串,这会让索引变得很大,查询时浪费大量的磁盘IO,影响查询效率,此时可以将字符串的一部分前缀建立索引,这样可以大大节约索引空间,从而提高索引效率。
6.11 单列索引与联合索引
- 单列索引:一个索引只包含单个列;
- 联合索引:一个索引包含了多个列;