MySQL STRAIGHT_JOIN STRAIGHT_JOIN 是 MySQL 对标准 SQL 的扩展,用于在多表查询时指定表载入的顺序。在 JOIN 表连接中,同样可以指定表载入的顺序,本文只讲述 STRAIGHT_JOIN 在表连接 JOIN 中的应用。 MySQL STRAIGHT_JOIN 语法如下: ... FROM tab...
问题
一个用户问题,数据从ECS迁移到RDS,相同的语句,查询性能下降了几十倍。而实际上RDS这个实例在内存上的配置与原来ECS上的实例相当。本文简单说明这个case的原因及建议。用户反馈性能变慢的语句为 (修改了真实表明和列名)select count(1)from HR hr join H h on h.hid = hr.hid join A e one.aid = h.eid join A t on t.aid = e.pid join A c on c.aid = t.pid join A p on p.aid = c.pidleft join U u on u.uid = hr.uId left join E emp on emp.eid = hr.oid where( hr.s in (1,2,3,4)and hr.cn = 0 );
背景MySQL执行语句过程中涉及到两大流程:优化器和执行器。其中优化器最主要的任务,是选择索引和在多表连接时选择连接顺序。在这个case中,join顺序的选择影响了执行性能。确定join执行顺序就需要估算所有join操作的代价。默认配置下MySQL会估算所有可能的组合。MySQL Tips: MySQL里限制一个查询的join表数目上限为61.对于一个有61个表参与的join操作,理论上需要61!(阶乘)次的评估。当然这是最坏情况下,实际上减枝算法会让这个数字看起来稍微好一点,但是仍然很恐怖。在多表join的场景下,为了避免优化器占用太多时间,MySQL提供了一个参数 optimizer_search_depth 来控制递归深度。这个参数对算法的控制可以简单描述为:对于所有的排列,只取前当前join顺序的前optimizer_search_depth个表估算代价。举例来说,20张表的,假设optimizer_search_depth为4,那么评估次数为20*19*18*17,虽然也很大(因此我们特别不建议这么多表的join),比20!好多了。于是optimizer_search_depth的选择就成了问题。MySQL Tips: MySQL中optimizer_search_depth默认值为62.也就是说默认为全排列计算。这样能够保证得到最优的执行计划,只是在有些场景下,决定执行计划的时间会远大于执行时间本身。
量化分析
在ECS上,是用户自己维护的MySQL,没有设置optimizer_search_depth,因此为默认的62.
在RDS上,我们的配置是4。
分析到这里大家能猜到原因是RDS配置的4导致没有得到最优的执行计划。下图是optimizer_search_depth=4时的explain结果(隐藏了业务相关的表名、字段名)下图是optimizer_search_depth=62是的场景,当然这个case的join表是8个,因此62和8在这里是等效的。从图1可以看到,由于optimizer_search_depth=4,优化器认为自己选择了最优的join顺序(22039*1*1*1),优于(41360*1*1*1),而实际上后者才是全局最优。有趣的是,在这个case里面如果多看一层,就能得到最有解,因为第一个join顺序的第五个表评估rows为82720。这意味着,在这个case里面,设置为5与设置为62能得到相同的执行计划,当然设置为5时的优化器执行代价更小。这其实也就是提供optimizer_search_depth的本意:减少优化器执行时间,而且概率上还存在局部最优就是全局最优解的情况。
关于实践
可配置的参数提供灵活性的同时,也提出一个头疼的问题:应该设置为多少才合适。
实际上当用户执行一个多表join的时候,对这个语句的整体RT的期望值就不会高。因此可以先定义一个预期,比如优化器决策join顺序的时间不能超过500ms。
用户规格与cpu相关,因此这个只能是建议值。
用户实践
实际上更重要的是对于用户来说:1) 当出现实例迁移后,多表join执行结果差异较大的时候,要考虑调整这个值。该参数是允许线程单独设置,因此对于应用层来说,每个连接应该都能得到一个较优的值。2) 反过来,当设置为默认的optimizer_search_depth=62时,我们我们如何评估我们这个设置是否过大?MySQL Tips:MySQL profiling 可以用于查看各执行环节的消耗时间。如下是笔者构造的一个60个表join查询的查询,使用profiling查看执行环节消耗的过程。set profiling=1;set optimizer_search_depth=4;explain select .......show profile for query 2; 结果如图继续执行set optimizer_search_depth=40;explain select .......show profile for query 4; 图中标红部分显示了两次优化器的执行时间差异。
小结1)根据机器配置估算一个可接受的时间,用于优化器选择join顺序。2)用profiling确定是否设置了过大的optimizer_search_depth。3)业务上优化,尽量不要使用超过10张表的多表join。4)PS:不要相信银弹。MySQL文档说设置为0则表示能够自动选择optimizer_search_depth的合理值,实际上代码上策略就是,如果join表数N<=7,则optimizer_search_depth=N+1,否则选N.
MySQL STRAIGHT_JOIN STRAIGHT_JOIN 是 MySQL 对标准 SQL 的扩展,用于在多表查询时指定表载入的顺序。在 JOIN 表连接中,同样可以指定表载入的顺序,本文只讲述 STRAIGHT_JOIN 在表连接 JOIN 中的应用。 MySQL STRAIGHT_JOI
Left join , Right Join, Inner Join 的相关内容,非常实用
一.先看一些最简单的例子
例子
Table Aaid adate 1 a1 2 a2 3 a3
TableB
bid bdate 1 b1 2
...联的方式或者说性能一直不太满意。对于开发提交的含有join的查询,一
一 介绍相信许多开发/DBA在使用MySQL的过程中,对于MySQL处理多表关联的方式或者说性能一直不太满意。对于开发提交的含有join的查...
hash join(HJ)是一种用于equi-join(而anti-join就是使用NOT IN时的join)的技术。在Oracle中,它是从7.3开始引入的,以代替sort
一、 hash join概念
hash join(HJ)是一种用于equi-join(而anti-
这篇文章主要介绍了Mysql join操作的相关资料,需要的朋友可以参考下 join的类型1. 内联结:将两个表中存在联结关系的字段符合联结关系的那些记录形成记录集的联结。2. 外联结:分为...
Join是关系型数据库系统的重要操作之一,SQL Server中包含的常用Join:内联接、外联接和交叉联接等1.1.1 摘要 Join是关系型数据库系统的重要操作之一,SQL Server中包含的常用Join:内联接、外联接和交叉联...
这篇文章主要介绍了Mysql join操作的相关资料,需要的朋友可以参考下 join的类型1. 内联结:将两个表中存在联结关系的字段符合联结关系的那些记录形成记录集的联结。2. 外联结:分为...
...前一贯的写作风格,以简单易懂的示例帮助大家了解各种join的区别。 为什么需要join 为什么需要join?join中文意思为连接,连接意味着关联即将一个表和多个表之间关联起来。在处理数据库表的时候,我们经常会...
... >1. 笛卡尔积(交叉连接) 在MySQL中可以为CROSS JOIN或者省略CROSS即JOIN,或者使用',' 如: [sql] view plain copy print ? SELECT * FROM table1 CR
LEFT JOIN 语法用法与实例MySQL LEFT JOIN 语法SQL(MySQL) LEFT JOIN 会取得左表(table1)全部记录,即使右表(table2)并无对应匹配记录。LEFT JOIN 基本语法如下:... FROM table1 LEFT JOIN table2 ON co