[黑马程序员]性能分析 索引优化
SQL性能分析
SQL执行频率
- 查看当前数据库的INSERT、UPDATE、DELETE、SELECT的访问频次
-- session 是查看当前会话 ;
-- global 是查询全局数据 ; SHOW GLOBAL STATUS LIKE 'Com_______';
- Com_delete: 删除次数
- Com_insert: 插入次数
- Com_select: 查询次数
- Com_update: 更新次数
- 我们可以查看到当前数据库到底是以查询为主,还是以增删改为主,从而为数据库优化提供参考依据
- 如果是以增删改为主,我们可以考虑不对其进行索引的优化
- 如果是以查询为主,那么就要考虑对数据库的索引进行优化了
慢查询日志 (如果是以查询为主的数据库)
- 慢查询日志记录了所有执行时间超过指定参数(long_query_time,单位:秒,默认10秒)的所有SQL语句的日志
- 查看是否开启
show VARIABLES LIKE 'slow_query_log'
- 开启 配置/etc/my.cnf
# 开启MySQL慢日志查询开关
slow_query_log=1
# 设置慢日志的时间为2秒,SQL语句执行时间超过2秒,就会视为慢查询,记录慢查询日志
long_query_time=2
- 重启服务
systemctl restart mysqld
- 日志存放位置
/var/lib/mysql/localhost-slow.log。
- 在慢查询日志中,只会记录执行时间超多预设时间(2s)的SQL,可以定位出执行效率比较低的SQL,从而有针对性的进行优化
profile详情
- 帮助我们了解时间都耗费到哪里去了
SELECT @@have_profiling ;
SELECT @@profiling
// 开启profiling
SET profiling = 1;
- 查看相关信息
-- 查看每一条SQL的耗时基本情况
show profiles;
-- 查看指定query_id的SQL语句各个阶段的耗时情况
show profile for query query_id;
-- 查看指定query_id的SQL语句CPU的使用情况
show profile cpu for query query_id;
explain
- 语法
-- 直接在select语句之前加上关键字
explain / desc EXPLAIN SELECT 字段列表 FROM 表名 WHERE 条件 ;
- Explain 执行计划中各个字段的含义
-
索引使用
最左前缀法则
- 最左前缀法则指的是查询从索引的最左列开始,并且不跳过索引中的列
- 最左前缀法则中指的最左边的列,是指在查询时,联合索引的最左边的字段(即是第一个字段)必须存在,与我们编写SQL时,条件编写的先后顺序无关。
范围查询
- 联合索引中,出现范围查询(>,<),范围查询右侧的列索引失效。
- 当范围查询使用>= 或 <= 时,所有的字段都是走索引
- 在业务允许的情况下,尽可能的使用类似于 >= 或 <= 这类的范围查询,而避免使用 > 或 <
- 比较
# 部分联合索引
explain select * from tb_user where profession = '软件工程' and age > 30 and status = '0';
# 全部联合索引
explain select * from tb_user where profession = '软件工程' and age >= 30 and status = '0';
索引失效情况
- 索引列运算
explain select * from tb_user where substring(phone,10,2) = '15';
- 字符串不加引号(对于对于字符串类型的字段)
explain select * from tb_user where profession = '软件工程' and age = 31 and status = '0';
explain select * from tb_user where profession = '软件工程' and age = 31 and status = 0;
-
模糊查询
- 如果仅仅是尾部模糊匹配,索引不会失效。如果是头部模糊匹配,索引失效。
-
or连接条件
- 用or分割开的条件,如果or前的条件中的列有索引,而后面的列中没索引,那么涉及的索引都不会被用到
- 当or连接的条件,左右两侧字段都有索引时,索引才会生效
-
数据分布影响
- MySQL在查询时,会评估使用索引的效率与走全表扫描的效率,如果走全表扫描更快,则放弃索引,走全表扫描
SQL提示
- 优化数据库的一个重要手段,简单来说,就是在SQL语句中加入一些人为的提示来达到优化操作的目的。
- use index
explain select * from tb_user use index(idx_user_pro) where profession = '软件工 程';
- ignore index
explain select * from tb_user ignore index(idx_user_pro) where profession = '软件工 程';
- force index : 强制使用索引
explain select * from tb_user force index(idx_user_pro) where profession = '软件工 程';
覆盖索引
- 覆盖索引是指 查询使用了索引,并且需要返回的列,在该索引中已经全部能够找到
- explain sql
- Using where; UsingIndex: 查找使用了索引,但是需要的数据都在索引列中能找到,所以不需要回表查询数据
- Using index condition: 查找使用了索引,但是需要回表查询数据
- 如何解决二级索引回表的问题:
- 建立联合索引,使二级索引变为联合索引的一部分
- explain sql
前缀索引
- 语法
create index idx_xxxx on table_name(column(n)) ;
- 前缀长度
- 根据索引的选择性来决定,而选择性是指不重复的索引值(基数)和数据表的记录总数的比值,索引选择性越高则查询效率越高, 唯一索引的选择性是1,这是最好的索引选择性,性能也是最好的
select count(distinct email) / count(*) from tb_user ;
select count(distinct substring(email,1,5)) / count(*) from tb_user ;
-
前缀索引的查询流程
-
-
单列索引与联合索引
- 单列索引:即一个索引只包含单个列
- 联合索引:即一个索引包含了多个列
索引设计原则
- 针对于数据量较大,且查询比较频繁的表建立索引
- 针对于常作为查询条件(where)、排序(order by)、分组(group by)操作的字段建立索引
- 尽量选择区分度高的列作为索引,尽量建立唯一索引,区分度越高,使用索引的效率越高
- 如果是字符串类型的字段,字段的长度较长,可以针对于字段的特点,建立前缀索引
- 尽量使用联合索引,减少单列索引,查询时,联合索引很多时候可以覆盖索引,节省存储空间,避免回表,提高查询效率
- 要控制索引的数量,索引并不是多多益善,索引越多,维护索引结构的代价也就越大,会影响增删改的效率
- 如果索引列不能存储NULL值,请在创建表时使用NOT NULL约束它。当优化器知道每列是否包含NULL值时,它可以更好地确定哪个索引最有效地用于查询