深入mysql索引_关于MySQL索引的深入解析

最新推荐文章于 2024-06-07 20:34:22 发布

抹茶柚子冰

最新推荐文章于 2024-06-07 20:34:22 发布

阅读量98

点赞数

文章标签：深入mysql索引

本文链接：https://blog.csdn.net/weixin_29895109/article/details/114020912

版权

本文介绍了MySQL优化器如何选择索引，以及如何通过EXPLAIN分析SQL性能。讲解了索引选择的因素，如扫描行数、排序和临时表，并详细解析了EXPLAIN输出的各个字段含义。当索引选错时，可通过force index、修改SQL或重建索引来优化。文章还讨论了MySQL如何计算行数，以及如何处理基数统计误差，建议定期使用ANALYZE TABLE更新索引统计。

摘要由CSDN通过智能技术生成

前言

我们知道，索引的选择是优化器阶段的工作，但是优化器并不是万能的，它有可能选错所要使用的索引。一般优化器选择索引考虑的因素有：扫描行数，是否排序，是否使用临时表。

使用explain分析sql

explain是很好的自测命令，勤于使用explain有助于我们写出更合理的sql语句以及建立更合理的索引：

mysql> explain select * from t where (a between 1 and 1000) and (b between 50000 and 100000) order by b limit 1;

+----+-------------+-------+------------+-------+---------------+------+---------+------+-------+----------+------------------------------------+

+----+-------------+-------+------------+-------+---------------+------+---------+------+-------+----------+------------------------------------+

| 1 | simple | t | null | range | a,b | b | 5 | null | 50223 | 1.00 | using index condition; using where |

+----+-------------+-------+------------+-------+---------------+------+---------+------+-------+----------+------------------------------------+

1 row in set, 1 warning (0.01 sec)

其中：

table字段：表示关于哪张表；

type字段：system，const，eq_reg，ref，range，index，all。一般来说要达到range级别以上；

system、const：可以将查询的变量转为常量，如id=1；id为主键或唯一键；

eq_ref：访问索引，返回某单一行的数据，通常在连接时出现，查询使用的索引为主键或唯一键；

ref：访问索引，返回某个值得数据(可能是多行)，通常使用=时发生；

range：使用索引返回一个范围内的行信息，如使用>，

index：以索引的顺序进行全表扫描，虽然有索引不用排序，但是要全表扫描；

all：全表扫描

key字段：实际使用的索引；

key_len字段：使用的索引长度(在不损失精度的情况下，长度越短越好)；

ref字段：显示索引的哪一列被使用了；

rows字段：mysql认为检索需要的数据行数；

extra字段：查询的额外信息，主要有以下几种：

using index：使用了索引

using where：使用了where条件

using tmporary：用到临时表去处理当前查询

using filesort：用到额外的排序，如order字段无索引

range checked for eache record(index map:n)：无索引可用

using index for group-by：表名可以在索引中找到分组所需的所有数据，不需要查询实际的表

一般遇到using temporary和using filesort就要想办法优化一下了，因为用不到索引。

mysql怎么计算需要检索的行数

实际中，mysql所统计的扫描行数并不是精确值，有时候甚至会相差很远，而扫描行数则是基于索引的基数来计算的。

在mysql中，通过采样统计的方式去获取索引基数：系统默认选取 n 个数据页，统计数据页上不同值得平均值，然后乘以索引的页面数得到基数，而且mysql会在变更的数据行数超过 1/m 时来触发重做索引统计的操作。

在mysql中，有2种存储索引统计的方式，可以通过设置innodb_stats_persistent参数来选择：

设置为 on 的时候，表示统计信息会持久化存储。这时，默认的 n 是 20，m 是 10。

设置为 off 的时候，表示统计信息只存储在内存中。这时，默认的 n 是 8，m 是 16。

一般来说，基数统计出来的数据和真实的行数没有很大差距，但是涉及到删除数据新增数据比较频繁的数据表，可能会出现数据表有10万条数据但是基数统计却有20万的情况，这就可能是mvcc在作怪了，因为mysql的innodb的事务支持，需要维持多个数据版本，就有可能某些事务还没结束，还在使用删除了很久的数据导致已删除的数据空间无法释放，而新增的数据又开辟了新的空间，那么这时候就导致基数统计中数据页数量可能出现失误，出现较大误差。

一个很好的修正方式就是执行analyze table 表名，该命令用来重新统计索引信息。

索引选错了我们到底怎么办

当我们正确的建立必须的索引后，大部分情况下，优化器其实并不会选择错索引，当我们遇到索引选错的情况下，该怎么去处理呢？

1、使用force index强制使用某个索引。

2、转换思路，优化一下sql语句可能就会使用到该使用的索引。

3、新建更合适的索引或删除掉误用到的不合理的索引。(有些时候，可能真的是这个索引是多余的，还不是最优的，优化器又刚好使用到了它)。

总结

以上就是这篇文章的全部内容了，希望本文的内容对大家的学习或者工作具有一定的参考学习价值，谢谢大家对萬仟网的支持。

希望与广大网友互动？？

点此进行留言吧！