sql优化——慢sql定位和优化

乐瓜乐虫

已于 2024-05-07 11:42:02 修改

阅读量31

点赞数

分类专栏：数据库性能测试性能优化文章标签： sql 数据库

于 2024-04-20 08:07:12 首次发布

原文链接：https://blog.csdn.net/my_miuye/article/details/125294804

版权

性能测试同时被 3 个专栏收录

19 篇文章 1 订阅

订阅专栏

数据库

8 篇文章 0 订阅

订阅专栏

性能优化

1 篇文章 0 订阅

订阅专栏

如何定位并优化慢查询SQL？

一般有3个思考方向

第一种：SQL优化

我们可以通过慢查询日志和慢查询日志分析工具得到有问题的SQL列表。检查所查字段是否都是必须的，是否查询了过多字段，查出了多余字段。
针对慢SQL，我们可以使用关键字explain来查看当前sql的执行计划.可以重点关注type key rows filterd等字段，从而定位该SQL执行慢的根本原因。再有的放矢的进行优化
ShowProfile是MySQL提供的可以用来分析当前会话中，SQL语句资源消耗情况的工具，可用于SQL调优的测量。在当前会话中.默认情况下处于showprofile 是关闭状态，打开之后保存最近15次的运行结果
针对运行慢的SQL，通过profile工具进行详细分析.可以得到SQL执行过程中所有的资源开销情况.如IO开销,CPU开销,内存开销等.

第二种：MySQL 程序配置优化

MySQL是一个经过互联网大厂验证过的生产级别的成熟数据库，对于Mysql数
据库本身的优化，一般是通过Mysql中的配置文件my.cnf来完成的，比如。

Mysql5.7版本默认的最大连接数是151个，这个值可以在etc/my.cnf中修改(永久修改)。
binlog日志，默认是不开启
缓存池bufferpoll的默认大小配置等。

由于这些配置一般都和用户安装的硬件环境以及使用场景有关系，因此这些配置
官方只会提供一个默认值，具体情况还得由使用者来修改。
关于配置项的修改，需要关注两个方面。

配置的作用域，分为会话级别和全局
是否支持热加载

因此，针对这两个点，我们需要注意的是：

全局参数的设定对于已经存在的会话无法生效
会话参数的设定随着会话的销毁而失效
全局类的统一配置建议配置在默认配置文件中，否则重启服务会导致配置失效

第三种：架构设计层面的优化

MySQL是一个磁盘IO访问量非常频繁的关系型数据库，在高并发和高性能的场景中.MySQL数据库必然会承受巨大的并发压力，而此时，我们的优化方式可以分为几个部分

搭建MySQL主从集群，单个服务容易单点故障，一旦服务器宕机，将会导致依赖Mysql数据库的应用全部无法响应。主从集群或者主主集群可以保证服务的高可用性。
读写分离设计，在读多写少的场景中，通过读写分离的方案，可以避免读写冲突导致的性能影响
引入分库分表机制，通过分库可以降低单个服务器节点的IO压力，通过分表
的方式可以降低单表数据量，从而提升sql查询的效率。
针对热点数据，可以引入更为高效的分布式数据库，比如Redis、MongoDB
等，他们可以很好的缓解Mysql的访问压力，同时还能提升数据检索性能。

第四种：硬件和操作系统层面的优化

从硬件层面来说，影响MySQL性能的因素有，CPU，可用内存大小，磁盘读写速度，网络带宽。
从操作系层面来说，应用文件句柄数、操作系统网络的配置都会影响到Mysql 性能。
这部分的优化一般由DBA或者运维工程师去完成。
在硬件基础资源的优化中，我们重点应该关注服务本身承载的体量，然后提出合理的指标要求，避免出现资源浪费

这里我们注意介绍第一种：索引优化。

一、定位慢SQL

1.首先确认是否开启了

首先开启慢查询日志，由参数slow_query_log决定是否开启，在MySQL命令行下输入下面的命令：

set global slow_query_log=on;

或者

mysql> show variables like "%slow%";

slow_query_log为OFF，表示未开启慢查询，直接set global slow_query_log=on;slow_query_log_file是存放慢查询日志的地址

（set global 只是全局session生效，重启后失效,如果需要以上配置永久生效，需要在mysql.ini（linux my.cnf）中配置）

2.设置慢查询的时间限制

mysql> show variables like "long_query_time";

value值即为操作时长大于该值后就认为是慢sql

测试时值可以设置得小些

3.查询慢查询日志可定位具体的慢sql

Time ：日志记录的时间

User@Host：执行的用户及主机

Query_time：查询耗费时间 Lock_time 锁表时间 Rows_sent 发送给请求方的记录条数 Rows_examined 语句扫描的记录条数

SET timestamp 语句执行的时间点

执行的语句

4.相关sql查询

查询mysql的操作信息show status 显示全部mysql操作信息

/* 获得mysql的插入次数; */
show status like "com_insert%"; 
/* 获得mysql的删除次数; */
show status like "com_delete%"; 
/* 获得mysql的查询次数; */
show status like "com_select%"; 
/* 获得mysql服务器运行时间; */
show status like "uptime"; 
/* 获得mysql连接次数; */
show status like 'connections'; 
/* 服务器启动以来执行时间最长的20条SQL语句; */

5.用Explain分析具体的sql语句

id:选择标识符

select_type:表示查询的类型。

table:输出结果集的表

partitions:匹配的分区

type:表示表的连接类型

possible_keys:表示查询时，可能使⽤的索引

key:表示实际使⽤的索引

key_len:索引字段的长度

ref:列与索引的比较

rows:扫描出的行数(估算的行数)

filtered:按表条件过滤的⾏百分比

Extra:执行情况的描述和说明

二、慢SQL优化

1. 不使用子查询

SELECT * FROM t1 WHERE id (SELECT id FROM t2 WHERE name='hechunyang');

（优化只针对SELECT有效，对UPDATE/DELETE子查询无效）

2.读取适当的记录LIMIT M,N

可以改为：

SELECT * FROM t WHERE 1 LIMIT 10;

3.分组统计可以禁止排序

SELECT goods_id,count(*) FROM t GROUP BY goods_id;

默认情况下，MySQL对所有GROUP BY col1，col2…的字段进⾏排序。如果查询包括GROUP BY，想要避免排序结果的消耗，则可以指定ORDER BY NULL禁止排序。

可以改为：

SELECT goods_id,count(*) FROM t GROUP BY goods_id ORDER BY NULL;

4.禁止不必要的ORDER BY排序

SELECT count(1) FROM user u LEFT JOIN user_info i ON u.id = i.user_id WHERE 1 = 1 ORDER BY u.create_time DESC;

可以改为：

SELECT count(1) FROM user u LEFT JOIN user_info i ON u.id = i.user_id;

5.尽量不要超过三个表join

需要join的字段，数据类型保持绝对一致；多表关联查询时，保证被关联的字段需要有索引

6.在varchar字段上建立索引时，必须指定索引长度

没必要对全字段建立索引，根据实际文本区分度决定索引长度。

索引的长度与区分度是一对矛盾体，一般对字符串类型数据，长度为20的索引，区分度会高达90%以上，可以使用count(distinct left(列名, 索引长度))/count(*)的区分度来确定

7.不要使用 select *

只返回需要的字段

8.排序请尽量使用升序

9.尽量使用数字型字段

若只含数值信息的字段尽量不要设计为字符型，这会降低查询和连接的性能，并会增加存储开销。

10.避免索引失效

10.1 字段类型转换导致不用索引

如字符串类型的不用引号，数字类型的用引号等，这有可能会用不到索引导致全表扫描；

10.2 根据联合索引的第二个及以后的字段单独查询用不到索引

10.3 字段前面不能加函数/加减运算，否则会导致索引失效

如下面语句将进行全表扫描：

select id from t where num/2=100 

SELECT * FROM t WHERE YEAR(d) >= 2016

可以改为：

select id from t where num=100*2 

SELECT * FROM t WHERE d >= '2016-01-01';

10.4 搜索严禁左模糊或者全模糊

select name from t where name like %s 
select name from t where name like %s%

如果需要请走搜索引擎来解决，因为索引文件具有B-Tree的最左前缀匹配特性，如果左边的值未确定，那么无法使用此索引。

10.5 避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描

select id from t where num != 2

可以改为：

select id from t where num > 2 and  num < 2

10.6 避免在 where 子句中对字段进行 null 值判断，否则将导致引擎放弃使用索引而进行全表扫描

select id from t where num is null

可以改为：设置num的默认值为0，确保没有null值

select id from t where num=0

10.7 用IN或UNION来替换OR低效查询

SELECT * FROM t WHERE LOC_ID = 10 OR LOC_ID = 20 OR LOC_ID = 30;

可以改为：

SELECT * FROM t WHERE LOC_IN IN (10,20,30);
或
SELECT * FROM t WHERE LOC_IN = 10 UNION ALL SELECT * FROM t WHERE LOC_IN = 20 UNION ALL SELECT * FROM t WHERE LOC_IN = 30

对于连续的数值，能用 between 就不要用 in 了

select id from t where num between 1 and 3

10.8 在 where 子句中使用参数，也会导致全表扫描
因为SQL只有在运行时才会解析局部变量，但优化程序不能将访问计划的选择推迟到运行时；它必须在编译时进行选择。然而，如果在编译时建立访问计划，变量的值还是未知的，因而无法作为索引选择的输入项。如下面语句将进行全表扫描：

select id from t where num=@num

可以改为强制查询使用索引：

select id from t with(index(索引名)) where num=@num

11.删除表所有记录请用 truncate，不要用 delete

12.存储过程和触发器设置
在所有的存储过程和触发器的开始处设置 SET NOCOUNT ON ，在结束时设置 SET NOCOUNT OFF 。无需在执行存储过程和触发器的每个语句后向客户端发送 DONE_IN_PROC 消息。

13.使用基于游标的方法或临时表
尽量避免使用游标，因为游标的效率较差

使用基于游标的方法或临时表方法之前，应先寻找基于集的解决方案来解决问题，基于集的方法通常更有效。

14.使用临时表
当需要重复引用大型表或常用表中的某个数据集时，可以使用临时表。但是，对于一次性事件，最好使用导出表。

在新建临时表时，如果一次性插入数据量很大，那么可以使用 select into 代替 create table，避免造成大量 log ，以提高速度；如果数据量不大，为了缓和系统表的资源，应先create table，然后insert。

如果使用到了临时表，在存储过程的最后务必将所有的临时表显式删除，先 truncate table ，然后 drop table ，这样可以避免系统表的较长时间锁定。

避免频繁创建和删除临时表，以减少系统表资源的消耗。

参考1

乐瓜乐虫

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
sql优化——慢sql定位和优化

一般有3个思考方向MySQL是一个经过互联网大厂验证过的生产级别的成熟数据库，对于Mysql数据库本身的优化，一般是通过Mysql中的配置文件my.cnf来完成的，比如。Mysql5.7版本默认的最大连接数是151个，这个值可以在my.cnf中修改。binlog日志，默认是不开启缓存池bufferpoll的默认大小配置等。由于这些配置一般都和用户安装的硬件环境以及使用场景有关系，因此这些配置官方只会提供一个默认值，具体情况还得由使用者来修改。关于配置项的修改，需要关注两个方面。
复制链接

扫一扫