MySQL执行SQL会经过SQL解析和查询优化的过程,解析器将SQL分解成数据结构并传递到后续步骤,查询优化器发现执行SQL查询的最佳方案、生成执行计划。查询优化器决定SQL如何执行,依赖于数据库的统计信息,下面我们介绍MySQL 5.7中innodb统计信息的相关内容。
MySQL统计信息的存储分为两种,非持久化和持久化统计信息。
一、非持久化统计信息
非持久化统计信息存储在内存里,如果数据库重启,统计信息将丢失。有两种方式可以设置为非持久化统计信息:
1 全局变量,
INNODB_STATS_PERSISTENT=OFF
2 CREATE/ALTER表的参数,
STATS_PERSISTENT=0
非持久化统计信息在以下情况会被自动更新:
1 执行ANALYZE TABLE
2 innodb_stats_on_metadata=ON情况下,执SHOW TABLE STATUS, SHOW INDEX, 查询 INFORMATION_SCHEMA下的TABLES, STATISTICS
3 启用--auto-rehash功能情况下,使用mysql client登录
4 表第一次被打开
5 距上一次更新统计信息,表1/16的数据被修改
非持久化统计信息的缺点显而易见,数据库重启后如果大量表开始更新统计信息,会对实例造成很大影响,所以目前都会使用持久化统计信息。
二、持久化统计信息
5.6.6开始,MySQL默认使用了持久化统计信息,即INNODB_STATS_PERSISTENT=ON,持久化统计信息保存在表mysql.innodb_table_stats和mysql.innodb_index_stats。
持久化统计信息在以下情况会被自动更新:
1 INNODB_STATS_AUTO_RECALC=ON
情况下,表中10%的数据被修改
2 增加新的索引
innodb_table_stats是表的统计信息,innodb_index_stats是索引的统计信息,各字段含义如下:
innodb_table_stats
database_name
数据库名
table_name
表名
last_update
统计信息最后一次更新时间
n_rows
表的行数
clustered_index_size
聚集索引的页的数量
sum_of_other_index_sizes
其他索引的页的数量