MySQL OPTIMIZER TRACE 详解

最新推荐文章于 2025-02-22 15:36:57 发布

eddie_k2

最新推荐文章于 2025-02-22 15:36:57 发布

阅读量1.3k

点赞数

分类专栏： MySQL 文章标签：数据库 mysql

本文链接：https://blog.csdn.net/eddielee9217/article/details/116748751

版权

MySQL 专栏收录该内容

8 篇文章

订阅专栏

文章目录

目录
- OPTIMIZER TRACE（优化器跟踪）

OPTIMIZER TRACE是MySQL5.6+引入的一项跟踪功能，它可以跟踪优化器做出的各种决策（比如访问表的方法、各种开销计算、各种转换等），并将跟踪结果记录到 INFORMATION_SCHEMA.OPTIMIZER_TRACE 表中。此功能默认关闭，开启后，可分析如下语句：

SELECT
INSERT
REPLACE
UPDATE
EXPLAIN
SET
DECLARE
CASE
IF
RETURN
CALL

OPTIMIZER TRACE 参数

TIPS

参考：https://dev.mysql.com/doc/internals/en/system-variables-controlling-trace.html

mysql> show variables like '%optimizer_trace%';
+------------------------------+----------------------------------------------------------------------------+
| Variable_name                | Value                                                                      |
+------------------------------+----------------------------------------------------------------------------+
| optimizer_trace              | enabled=off,one_line=off                                                   |
| optimizer_trace_features     | greedy_search=on,range_optimizer=on,dynamic_range=on,repeated_subselect=on |
| optimizer_trace_limit        | 1                                                                          |
| optimizer_trace_max_mem_size | 1048576                                                                    |
| optimizer_trace_offset       | -1                                                                         |
+------------------------------+----------------------------------------------------------------------------+
5 rows in set (0.01 sec)

optimizer_trace
- optimizer_trace 总开发，默认值：enabled=off, one_line=off
- enabled：是否开启 optimizer_trace；on表示开启，off表示关闭。
- one_line：是否开启单行存储。on表示开启；off表示关闭，将会用标准的JSON格式化存储。设置成on将会有良好的格式，设置成off可节省一些空间。（一般不建议开启）
optimizer_trace_features
- 控制 optimizer_trace 跟踪的内容，默认值：greedy_search=on,range_optimizer=on,dynamic_range=on,repeated_subselect=on，表示开启所有的跟踪项目。
  - greedy_search：是否跟踪贪心搜索，有关贪心算法想见 https://blog.csdn.net/weixin_42813521/article/details/105563103
  - range_optimizer：是否跟踪范围优化器
  - dynamic_range：是否跟踪动态范围优化
  - repeated_subselect：是否跟踪子查询，如果设置成off，只跟踪第一条item_subselect的执行
  - 详见（英文）： https://dev.mysql.com/doc/internals/en/optimizer-features-to-trace.html
optimizer_trace_max_mem_size：控制 optimizer_trace 展示多少条结果，默认1
optimizer_trace_limit：optimizer_trace 堆栈信息允许的最大内存，默认1048576
optimizer_trace_offset：第一个展示 optimizer_trace 的偏移量，默认-1
end_markers_in_json：如果JSON结构很大，则很难将右括号和左括号配对。为了帮助读者阅读，可将其设置成on，这样会在右括号附加上注释，默认off

参考： https://dev.mysql.com/doc/internals/en/end-markers-in-json-system-variable.html

8.11 end_markers_in_json系统变量

如果JSON结构很大，则很难将其右括号和左括号配对；为了帮助读者（但这不兼容JSON），设置@@ end_markers_in_json = on会在右括号附近重复该结构的键（如果有）。它也以相同的方式影响“ EXPLAIN FORMAT = JSON”。请注意，在MySQL 5.6.6之前，此变量不存在，而只是@@ optimizer_trace变量中的一个开关（已使用“ setoptimizer_trace =“ end_marker = on”;“设置）。

TIPS

- 以上参数可用SET语句操作，例如，用如下命令即可打开 OPTIMIZER TRACE

SET OPTIMIZER_TRACE"enabled=on",END_MARKERS_IN_JSON=on;

也可用SET GLOBAL 全局开启。但即使全局开启 OPTIMIZER_TRACE，每个Session也只能跟踪它自己执行的语句：

SET GLOBAL OPTIMIZER_TRACE"enabled=on",END_MARKERS_IN_JSON=on;

- optimizer_trace_limit 和 optimizer_trace_offset 这两个参数经常配合使用，例如：

SET optimizer_trace_offset=<OFFSET>, optimizer_trace_limit=<KIMIT>

这两个参数配合使用，有点类似MySQL里面的limit语句。

默认情况下，由于 optimizer_trace_offset-1, optimizer_trace_limit=1, 记录最近的一条SQL语句，展示时，每次展示1条数据；

如果改成 optimizer_trace_offset-2, optimizer_trace_limit=1, 则会记录最近的两条SQL语句；

有关 optimizer_trace_limit 和 optimizer_trace_offset 更多细节，可参考：

https://dev.mysql.com/doc/internals/en/tuning-trace-purging.html

OPTIMIZER TRACE 使用

开启OPTIMIZER_TRACE功能，并且设置要展示的数据条目数
发送你想要分析的查询语句
使用如下语句分析，即可获得类似如下的结果


mysql> SET OPTIMIZER_TRACE="enabled=on",END_MARKERS_IN_JSON=on;
Query OK, 0 rows affected (0.00 sec)


mysql> SET optimizer_trace_offset=-30, optimizer_trace_limit=20;
Query OK, 0 rows affected (0.00 sec)


mysql> SELECT * FROM salaries WHERE from_date = '1986-06-26' and to_date = '1987-06-26';
+--------+--------+------------+------------+
| emp_no | salary | from_date  | to_date    |
+--------+--------+------------+------------+
|  10001 |  60117 | 1986-06-26 | 1987-06-26 |
|  25676 |  40158 | 1986-06-26 | 1987-06-26 |
|  27425 |  40000 | 1986-06-26 | 1987-06-26 |
|  28757 |  40597 | 1986-06-26 | 1987-06-26 |
|  29250 |  60178 | 1986-06-26 | 1987-06-26 |
|        |        |            |            |
| 498565 |  73492 | 1986-06-26 | 1987-06-26 |
+--------+--------+------------+------------+
86 rows in set (0.47 sec)


mysql> SELECT * FROM INFORMATION_SCHEMA.OPTIMIZER_TRACE limit 30 \G;
*************************** 1. row ***************************
                            QUERY: select *
    from salaries
    where from_date = '1986-06-26'
      and to_date = '1987-06-26'
                            TRACE: {
  "steps": [
    {
      "join_preparation": {
        "select#": 1,
        "steps": [
          {
            "expanded_query": "/* select#1 */ select `salaries`.`emp_no` AS `emp_no`,`salaries`.`salary` AS `salary`,`salaries`.`from_date` AS `from_date`,`salaries`.`to_date` AS `to_date` from `salaries` where ((`salaries`.`from_date` = '1986-06-26') and (`salaries`.`to_date` = '1987-06-26'))"
          }
        ] /* steps */
      } /* join_preparation */
    },
    {
      "join_optimization": {
        "select#": 1,
        "steps": [
          {
            "condition_processing": {
              "condition": "WHERE",
              "original_condition": "((`salaries`.`from_date` = '1986-06-26') and (`salaries`.`to_date` = '1987-06-26'))",
              "steps": [
                {
                  "transformation": "equality_propagation",
                  "resulting_condition": "(multiple equal('1986-06-26', `salaries`.`from_date`) and multiple equal('1987-06-26', `salaries`.`to_date`))"
                },
                {
                  "transformation": "constant_propagation",
                  "resulting_condition": "(multiple equal('1986-06-26', `salaries`.`from_date`) and multiple equal('1987-06-26', `salaries`.`to_date`))"
                },
                {
                  "transformation": "trivial_condition_removal",
                  "resulting_condition": "(multiple equal(DATE'1986-06-26', `salaries`.`from_date`) and multiple equal(DATE'1987-06-26', `salaries`.`to_date`))"
                }
              ] /* steps */
            } /* condition_processing */
          },
          {
            "substitute_generated_columns": {
            } /* substitute_generated_columns */
          },
          {
            "table_dependencies": [
              {
                "table": "`salaries`",
                "row_may_be_null": false,
                "map_bit": 0,
                "depends_on_map_bits": [
                ] /* depends_on_map_bits */
              }
            ] /* table_dependencies */
          },
          {
            "ref_optimizer_key_uses": [
            ] /* ref_optimizer_key_uses */
          },
          {
            "rows_estimation": [
              {
                "table": "`salaries`",
                "table_scan": {
                  "rows": 2838649,
                  "cost": 3368.9
                } /* table_scan */
              }
            ] /* rows_estimation */
          },
          {
            "considered_execution_plans": [
              {
                "plan_prefix": [
                ] /* plan_prefix */,
                "table": "`salaries`",
                "best_access_path": {
                  "considered_access_paths": [
                    {
                      "rows_to_scan": 2838649,
                      "access_type": "scan",
                      "resulting_rows": 2.84e6,
                      "cost": 287234,
                      "chosen": true
                    }
                  ] /* considered_access_paths */
                } /* best_access_path */,
                "condition_filtering_pct": 100,
                "rows_for_plan": 2.84e6,
                "cost_for_plan": 287234,
                "chosen": true
              }
            ] /* considered_execution_plans */
          },
          {
            "attaching_conditions_to_tables": {
              "original_condition": "((`salaries`.`to_date` = DATE'1987-06-26') and (`salaries`.`from_date` = DATE'1986-06-26'))",
              "attached_conditions_computation": [
              ] /* attached_conditions_computation */,
              "attached_conditions_summary": [
                {
                  "table": "`salaries`",
                  "attached": "((`salaries`.`to_date` = DATE'1987-06-26') and (`salaries`.`from_date` = DATE'1986-06-26'))"
                }
              ] /* attached_conditions_summary */
            } /* attaching_conditions_to_tables */
          },
          {
            "finalizing_table_conditions": [
              {
                "table": "`salaries`",
                "original_table_condition": "((`salaries`.`to_date` = DATE'1987-06-26') and (`salaries`.`from_date` = DATE'1986-06-26'))",
                "final_table_condition   ": "((`salaries`.`to_date` = DATE'1987-06-26') and (`salaries`.`from_date` = DATE'1986-06-26'))"
              }
            ] /* finalizing_table_conditions */
          },
          {
            "refine_plan": [
              {
                "table": "`salaries`"
              }
            ] /* refine_plan */
          }
        ] /* steps */
      } /* join_optimization */
    },
    {
      "join_execution": {
        "select#": 1,
        "steps": [
        ] /* steps */
      } /* join_execution */
    }
  ] /* steps */
}
MISSING_BYTES_BEYOND_MAX_MEM_SIZE: 0
          INSUFFICIENT_PRIVILEGES: 0
1 row in set (0.00 sec)

ERROR: 
No query specified

分析完成，关闭 OPTIMIZER_TRACE

mysql> SET OPTIMIZER_TRACE="enabled=off";               
Query OK, 0 rows affected (0.00 sec)

OPTIMIZER_TRACE 结果分析

由上面的结果可知，OPTIMIZER_TRACE有四个字段：

QUERY：查询语句•TRACE：QUERY字段对应语句的跟踪信息•MISSING_BYTES_BEYOND_MAX_MEM_SIZE：跟踪信息过长时，被截断的跟踪信息的字节数。•INSUFFICIENT_PRIVILEGES：执行跟踪语句的用户是否有查看对象的权限。当不具有权限时，该列信息为1且TRACE字段为空，一般在调用带有SQL SECURITY DEFINER的视图或者是存储过程的情况下，会出现此问题。

TIPS

参考：https://dev.mysql.com/doc/refman/8.0/en/optimizer-trace-table.html

最核心的是TRACE字段的内容。我们逐段分析：

join_preparation

join_preparation段落展示了准备阶段的执行过程。

{
  "join_preparation": {
    "select#": 1,
    "steps": [
      {
        "expanded_query": "/* select#1 */ select `salaries`.`emp_no` AS `emp_no`,`salaries`.`salary` AS `salary`,`salaries`.`from_date` AS `from_date`,`salaries`.`to_date` AS `to_date` from `salaries` where ((`salaries`.`from_date` = '1986-06-26') and (`salaries`.`to_date` = '1987-06-26'))"
      }
    ] /* steps */
  } /* join_preparation */
},

join_optimization

join_optimization展示了优化阶段的执行过程，是分析OPTIMIZER TRACE的重点。这段内容超级长，而且分了好多步骤，不妨按照步骤逐段分析：

condition_processing

该段用来做条件处理，主要对WHERE条件进行优化处理。

"condition_processing": {
  "condition": "WHERE",
  "original_condition": "((`salaries`.`from_date` = '1986-06-26') and (`salaries`.`to_date` = '1987-06-26'))",
  "steps": [
    {
      "transformation": "equality_propagation",
      "resulting_condition": "(multiple equal('1986-06-26', `salaries`.`from_date`) and multiple equal('1987-06-26', `salaries`.`to_date`))"
    },
    {
      "transformation": "constant_propagation",
      "resulting_condition": "(multiple equal('1986-06-26', `salaries`.`from_date`) and multiple equal('1987-06-26', `salaries`.`to_date`))"
    },
    {
      "transformation": "trivial_condition_removal",
      "resulting_condition": "(multiple equal(DATE'1986-06-26', `salaries`.`from_date`) and multiple equal(DATE'1987-06-26', `salaries`.`to_date`))"
    }
  ] /* steps */
} /* condition_processing */
},

其中：

condition：优化对象类型。WHERE条件句或者是HAVING条件句•original_condition：优化前的原始语句•steps：主要包括三步，分别是quality_propagation（等值条件句转换），constant_propagation（常量条件句转换），trivial_condition_removal（无效条件移除的转换）
transformation：转换类型句•resulting_condition：转换之后的结果输出

substitute_generated_columns

substitute_generated_columns用于替换虚拟生成列

"substitute_generated_columns": {
} /* substitute_generated_columns */

table_dependencies

分析表之间的依赖关系

{
"table_dependencies": [
  {
    "table": "`salaries`",
    "row_may_be_null": false,
    "map_bit": 0,
    "depends_on_map_bits": [
    ] /* depends_on_map_bits */
  }
] /* table_dependencies */
},

其中：

table：涉及的表名，如果有别名，也会展示出来•row_may_be_null：行是否可能为NULL，这里是指JOIN操作之后，这张表里的数据是不是可能为NULL。如果语句中使用了LEFT JOIN，则后一张表的row_may_be_null会显示为true•map_bit：表的映射编号，从0开始递增
depends_on_map_bits：依赖的映射表。主要是当使用STRAIGHT_JOIN强行控制连接顺序或者LEFT JOIN/RIGHT JOIN有顺序差别时，会在depends_on_map_bits中展示前置表的map_bit值。

ref_optimizer_key_uses

列出所有可用的ref类型的索引。如果使用了组合索引的多个部分（例如本例，用到了index(from_date, to_date) 的多列索引），则会在ref_optimizer_key_uses下列出多个元素，每个元素中会列出ref使用的索引及对应值。

rows_estimation

顾名思义，用于估算需要扫描的记录数。

其中：

table：表名
range_analysis：
table_scan：如果全表扫描的话，需要扫描多少行（row，2838216），以及需要的代价（cost，286799）
potential_range_indexes：列出表中所有的索引并分析其是否可用。如果不可用的话，会列出不可用的原因是什么；如果可用会列出索引中可用的字段；
setup_range_conditions：如果有可下推的条件，则带条件考虑范围查询
group_index_range：当使用了GROUP BY或DISTINCT时，是否有合适的索引可用。当未使用GROUP BY或DISTINCT时，会显示chosen=false, cause=not_group_by_or_distinct；如使用了GROUP BY或DISTINCT，但是多表查询时，会显示chosen=false，cause =not_single_table。其他情况下会尝试分析可用的索引（potential_group_range_indexes）并计算对应的扫描行数及其所需代价
skip_scan_range：是否使用了skip scan

TIPS

skip_scan_range是MySQL 8.0的新特性，感兴趣的可详见 https://blog.csdn.net/weixin_43970890/article/details/89494915

analyzing_range_alternatives：分析各个索引的使用成本
range_scan_alternatives：range扫描分析
index：索引名•ranges：range扫描的条件范围•index_dives_for_eq_ranges：是否使用了index dive，该值会被参数eq_range_index_dive_limit变量值影响。•rowid_ordered：该range扫描的结果集是否根据PK值进行排序•using_mrr：是否使用了mrr•index_only：表示是否使用了覆盖索引•rows：扫描的行数•cost：索引的使用成本•chosen：表示是否使用了该索引
analyzing_roworder_intersect：分析是否使用了索引合并（index merge），如果未使用，会在cause中展示原因；如果使用了索引合并，会在该部分展示索引合并的代价。
chosen_range_access_summary：在前一个步骤中分析了各类索引使用的方法及代价，得出了一定的中间结果之后，在summary阶段汇总前一阶段的中间结果确认最后的方案
range_access_plan：range扫描最终选择的执行计划。
type：展示执行计划的type，如果使用了索引合并，则会显示index_roworder_intersect•index：索引名•rows：扫描的行数•ranges：range扫描的条件范围
rows_for_plan：该执行计划的扫描行数•cost_for_plan：该执行计划的执行代价•chosen：是否选择该执行计划

considered_execution_plans

负责对比各可行计划的开销，并选择相对最优的执行计划。

{
"considered_execution_plans": [
  {
    "plan_prefix": [
    ] /* plan_prefix */,
    "table": "`salaries`",
    "best_access_path": {
      "considered_access_paths": [
        {
          "rows_to_scan": 2838649,
          "access_type": "scan",
          "resulting_rows": 2.84e6,
          "cost": 287234,
          "chosen": true
        }
      ] /* considered_access_paths */
    } /* best_access_path */,
    "condition_filtering_pct": 100,
    "rows_for_plan": 2.84e6,
    "cost_for_plan": 287234,
    "chosen": true
  }
] /* considered_execution_plans */
},

其中：

plan_prefix：当前计划的前置执行计划。•table：涉及的表名，如果有别名，也会展示出来•best_access_path：通过对比considered_access_paths，选择一个最优的访问路径
considered_access_paths：当前考虑的访问路径
access_type：使用索引的方式，可参考explain中的type字段
- index：索引
- rows：行数
- cost：开销
- chosen：是否选用这种执行路径
condition_filtering_pct：类似于explain的filtered列，是一个估算值
- rows_for_plan：执行计划最终的扫描行数，由considered_access_paths.rows X condition_filtering_pct计算获得。
- cost_for_plan：执行计划的代价，由considered_access_paths.cost相加获得•chosen：是否选择了该执行计划

attaching_conditions_to_tables

基于considered_execution_plans中选择的执行计划，改造原有where条件，并针对表增加适当的附加条件，以便于单表数据的筛选。

TIPS

这部分条件的增加主要是为了便于ICP（索引条件下推），但ICP是否开启并不影响这部分内容的构造。•ICP参考文档：https://www.cnblogs.com/Terry-Wu/p/9273177.html

{
"attaching_conditions_to_tables": {
  "original_condition": "((`salaries`.`to_date` = DATE'1987-06-26') and (`salaries`.`from_date` = DATE'1986-06-26'))",
  "attached_conditions_computation": [
  ] /* attached_conditions_computation */,
  "attached_conditions_summary": [
    {
      "table": "`salaries`",
      "attached": "((`salaries`.`to_date` = DATE'1987-06-26') and (`salaries`.`from_date` = DATE'1986-06-26'))"
    }
  ] /* attached_conditions_summary */
} /* attaching_conditions_to_tables */
},

其中：

original_condition：原始的条件语句
attached_conditions_computation：使用启发式算法计算已使用的索引，如果已使用的索引的访问类型是ref，则计算用range能否使用组合索引中更多的列，如果可以，则用range的方式替换ref。
attached_conditions_summary：附加之后的情况汇总
table：表名
attached：附加的条件或原语句中能直接下推给单表筛选的条件。

finalizing_table_conditions

最终的、经过优化后的表条件。

{
"finalizing_table_conditions": [
  {
    "table": "`salaries`",
    "original_table_condition": "((`salaries`.`to_date` = DATE'1987-06-26') and (`salaries`.`from_date` = DATE'1986-06-26'))",
    "final_table_condition   ": "((`salaries`.`to_date` = DATE'1987-06-26') and (`salaries`.`from_date` = DATE'1986-06-26'))"
  }
] /* finalizing_table_conditions */
},

refine_plan

改善执行计划：

{
"refine_plan": [
  {
    "table": "`salaries`"
  }
] /* refine_plan */
}

其中：

table：表名及别名

join_execution

join_execution段落展示了执行阶段的执行过程

{
  "join_execution": {
    "select#": 1,
    "steps": [
    ] /* steps */
}