MySQL的优化

最新推荐文章于 2024-08-03 10:34:30 发布

青城一号线

最新推荐文章于 2024-08-03 10:34:30 发布

阅读量54

点赞数

文章标签： mysql 数据库

本文链接：https://blog.csdn.net/qq_45692444/article/details/131662872

版权

文章介绍了在MySQL数据库中如何进行性能优化，包括通过监控SQL执行频率、使用慢查询日志定位低效SQL、分析执行计划（如EXPLAIN命令）以及优化索引。此外，还提到了showprofile和trace分析工具，以及批量插入数据和优化orderby、子查询和LIMIT查询的策略。

摘要由CSDN通过智能技术生成

概念

在应用的的开发过程中，由于初期数据量小，开发人员写 SQL 语句时更重视功能上的实现，但是当应用系统正式上线后，随着生产数据量的急剧增长，很多 SQL 语句开始逐渐显露出性能问题，对生产的影响也越来越大，此时这些有问题的 SQL 语句就成为整个系统性能的瓶颈，因此我们必须要对它们进行优化。
MySQL的优化方式有很多，大致我们可以从以下几点来优化MySQL:
- 从设计上优化
- 从查询上优化从
- 索引上优化从
- 存储上优化

查看SQL执行频率

MySQL客户端连接成功后，通过show[session | global] status 命令可以查看服务器状态信息。通过查看状态信息可以查看对当前数据库的主要操作类型。
下面的命令显示了当前session 中所有统计参数的值
- show session status like 'Com_______'; -- 查看当前会话统计结果
- show global status like 'Com_______'; -- 查看自数据库上次启动至今统计结果
- show status like 'Innodb_rows%'; --查看针对Innodb引擎的统计结果

定位低效率执行SQL

可以通过以下两种方式定位执行效率较低的SQL语句
- 慢查询日志:通过慢查询日志定位那些执行效率较低的 SQL语句
- show processlist: 该命令查看当前MySQL在进行的线程，包括线程的状态、是否锁表等，可以实时地查看SQL的执行情况，同时对一些锁表操作进行优化。
```
查看慢日志配置信息
show variables like '%slow_query_log%';

开启慢日志查询
set global slow_query_log=l;

查看慢日志记录SOL的最低值时间
show variables like 'long_query_time%';

修改慢日志记录SOL的最低阈值时间
set global long_query_time=4;
```

explain分析执行计划

通过以上步骤查询到效率低的SQL语句后，可以通过EXPLAIN命令获取MySQL如何执行SELECT语句的信息包括在 SELECT 语句执行过程中表如何连接和连接的顺序。

Explain分析执行计划-Explain 之 id

id 字段是 select查询的序列号，是一组数字，表示的是查询中执行selet子句或者是操作表的顺序。id 情况有三种：
- id 相同表示加载表的顺序是从上到下。
- id 不同id值越大，优先级越高，越先被执行
- id有相同，也有不同，同时存在。id相同的可以认为是一组，从上往下顺序执行:在所有的组中，id的值越大，优先级越高，越先执行

Explain分析执行计划-Explain 之 select_type

表示 SELECT的类型，常见的取值，如下表所示

Explain分析执行计划-Explain 之 type

type 显示的是访问类型，是较为重要的一个指标，可取值为:

结果值从最好到最坏以此是: system > const > eq_ref> ref> range > index > ALL

Explain分析执行计划-其他指标字段

Explain 之 table
- 显示这一步所访问数据库中表名称有时不是真实的表名字，可能是简称

Explain 之 rows
- 扫描行的数量
Explain 之 key
- possible_keys：显示可能应用在这张表的索引，一个或多个
- key：实际使用的索引，如果为NULL，则没有使用索引。
- key_len:表示索引中使用的字节数，该值为索引字段最大可能长度，并非实际使用长度，在不损失精确性的前提下，长度越短越好。

Explain 之 extra
- 其他的额外的执行计划信息，在该列展示

show profile分析SQL

Mysql从5.0.37版本开始增加了对 show profiles和 show profle 语句的支持。show profiles 能够在做SQL优化时帮助我们了解时间都耗费到哪里去了。
通过 have_profiling 参数，能够看到当前MySQL是否支持profile:
```
select @@have_profiling;
set profiling=1;-- 开启profiling 开关;
```
执行完SQL命令之后，再执行show profiles 指令，来查看SQL语句执行的耗时:
```
show profiles;
```
通过show profile for query query_id语可以查看到该SQL执行过程中每个程的状态和消耗的时间
在获取到最消耗时间的线程状态后，MySQL支持进一步选择all、cpu、 block io 、context switch、page faults等明细类型类查看MySQL在使用什么资源上耗费了过高的时间。

trace分析优化器执行计划

MysQL5.6提供了对SQL的跟踪trace,通过trace文件能够进一步了解为什么优化器选择A计划,而不是选择B计划

打开trace，设置格式为JSON，并设置trace最大能够使用的内存大小，避免解析过程中因为默认内存过小而不能够完整展示。
```
SET optimizer_trace="enabled=on",end_markers_in_json=on;
set optimizer_trace_max mem_size=1000000;
```
最后，检查information schema.optimizer_trace就可以知道MySQL是如何执行SQL的:
```
select * from information_schema.optimizer_trace \G;
```

使用索引优化

索引是数据库优化最常用也是最重要的手段之一,通过索引通常可以帮助用户解决大多数的MysQL的性能优化问题。
避免索引失效应用-全值匹配。
避免索引失效应用-最左前缀法则。
范围查询右边的列，不能使用索引。
尽量使用覆盖索引，避免select *。
用or分割开的条件，那么涉及的索引都不会被用到。
以%开头的Like模糊查询，索引失效。
如果MySQL评估使用索引比全表更慢，则不使用索引。
is NULL ， is NOT NULL 有时有效，有时索引失效。
in 走索引， not in 索引失效。
单列索引和复合索引，尽量使用复合索引。

SQL优化

大批量插入数据

当使用load 命令导入数据的时候，适当的设置可以提高导入的效率。对于 innoDB 类型的表，有以下几种方式可以提高导入的效率:
- 主键顺序插入：因为InnoDB类型的表是按照主键的顺序保存的，所以将导入的数据按照主键的顺序排列，可以有效的提高导入数据的效率。如果innoDB表没有主键，那么系统会自动默认创建一个内部列作为主键，所以如果可以给表创建一个主键将可以利用这点，来提高导入数据的效率。
- 关闭唯一性校验：在导入数据前执行SETUNIQUE CHECKS=0，关闭唯一性校验，在导入结束后执行SETUNIQUE CHECKS=1，恢复唯一性校验，可以提高导入的效率。

优化insert语句

当进行数据的insert操作的时候，可以考虑采用以下几种优化方案

如果需要同时对一张表插入很多行数据时，应该尽量使用多个值表的insert语句，这种方式将大大的缩减客户端与数据库之间的连接、关闭等消耗。使得效率比分开执行的单个insert语句快。
在事务中进行数据插入。

优化order by语句

两种排序方式

第一种是通过对返回数据进行排序，也就是通常说的 filesort 排序，所有不是通过索引直接返回排序结果的排序都叫FileSort 排序。
第二种通过有序索引顺序扫描直接返回有序数据，这种情况即为 using index，不需要额外排序，操作效率高。

Filesort 的优化

通过创建合适的索引，能够减少 Filesot的出现，但是在某些情况下，条件限制不能让Flesot消失，那就需要加快 Filesot的排序操作。对于Filesort，MySQL 有两种排序算法:
- 两次扫描算法:MySQL4.1之前，使用该方式排序。首先根据条件取出排序字段和行指针信息，然后在排序区 sot buffer 中排序，如果sot buffer不够，则在临时表 temporary table 中存储排序结果。完成排序之后，再根据行指针回表读取记录，该操作可能会导致大量随机I/O操作。
- 一次扫描算法:一次性取出满足条件的所有字段，然后在排序区 sort buffer 中排序后直接输出结果集。排序时内存开销较大，但是排序效率比两次扫描算法要高
MySQL通过比较系统变量 max length for sot data 的大小和Query语句取出的字段总大小，来判定是否那种排序算法，如果max_length_for_sort data 更大，那么使用第二种优化之后的算法;否则使用第一种。
可以适当提高 sort_buffer_size 和max length_for_sort_data 系统变量，来增大排序区的大小，提高排序的效率。

优化子查询

使用子查询可以一次性的完成很多逻辑上需要多个步骤才能完成的SQL操作，同时也可以避免事务或者表锁死，并且写起来也很容易。但是，有些情况下，子查询是可以被更高效的连接 (JOIN) 替代。
连接Join)查询之所以更有效率一些，是因为MSQL不需要在内存中创建临时表来完成这个逻辑上需要两个步骤的查询工作。