Oceanbase查询改写:子查询合并

概述

当SQL中存在多个子查询条件时,查询性能往往会受到较大影响。为此,Oceanbase中定义了子查询合并规则,能够将满足条件的多个子查询进行合并,从而减少不必要的子查询,提升查询性能。

基本原理

子查询合并规则主要包含对以下两种情况的处理:

  1. 同类型子查询合并:当查询语句中存在多个同类型(如同为exist或any类型)的子查询条件,且子查询的返回结果间存在包含关系时,可以移除多余的子查询。

  1. 不同类型子查询合并:当查询语句中存在多个满足特定组合(exist/not_exist,any/all)的子查询条件,且子查询的返回结果间存在包含关系时,对组合内的子查询进行合并。

同类型子查询合并

考虑如下情况:

SELECT * FROM t1 WHERE EXIST (SELECT 1 FROM t2 WHERE c2 = 0) --子查询1
        AND EXIST (SELECT 1 FROM t2)                          --子查询2

上述例子中存在两个exist子查询条件,其中子查询1的返回结果是子查询2返回结果的子集。可以看出,当子查询1为true时,子查询2必为true,因此可以将子查询2移除,如下所示:

SELECT * FROM t1 WHERE EXIST (SELECT 1 FROM t2 WHERE c2 = 0)

不同类型子查询合并

不同类型子查询合并主要分为两种情况:

  1. 冲突改写:对于组合中的子查询条件,如果子查询的返回结果间存在包含关系,且子查询条件间存在语义上的冲突时,将其改写为false表达式。

  1. 子查询合并:对于组合中的子查询条件,如果子查询的返回结果间存在包含关系,且子查询条件不存在语义上的冲突时,将它们合并成为一个子查询条件。

冲突改写

考虑如下情况:

SELECT * FROM t1 WHERE EXIST (SELECT 1 FROM t2 WHERE c1 = 0)  --子查询1
         AND NOT EXIST (SELECT 1 FROM t2)                      --子查询2

上述例子中存在两个子查询条件,分别为exist子查询和not_exist子查询条件,其中子查询1的返回结果是子查询2返回结果的子集。可以看出,当子查询1为true时,子查询2必为false,因此可以将子查询条件改为false表达式,如下所示:

SELECT * FROM t1 WHERE false

子查询合并

接下来再考虑另一种情况:

SELECT * FROM t1 WHERE EXIST (SELECT 1 FROM t2)           --子查询1
      AND NOT EXIST (SELECT 1 FROM t2 WHERE c2 = 0)      --子查询2

与上一种情况不同的是,子查询2的返回结果变成了子查询1返回结果的子集。基于关系代数转换,可以将子查询2合并到子查询1中,得到等价的查询条件,如下所示:

SELECT * FROM t1 WHERE EXIST (SELECT 1 FROM t2 WHERE c2 <> 0)

代码解析

子查询合并规则的入口为ObTransformSubqueryCoalesce::transform_one_stmt,该函数的主要执行流程如下:

  1. 调用transform_same_exprs函数对where和having部分的查询条件进行同类型子查询的合并处理。

  1. 调用transform_diff_exprs函数对where和having部分的查询条件进行不同类型子查询的合并处理。由于该转换并不一定总能产生更好的执行计划,因此在转换结束后需要调用accept_transform函数判断是否应该保留本次转换结果。

同类型子查询合并

transform_same_exprs函数负责进行同类型子查询的合并,执行流程如下:

  1. 调用classify_conditions函数,找到查询语句中所有的子查询条件。

  1. 遍历需要转换的子查询类型,调用get_same_classify_exprs函数找到符合当前子查询类型的子查询集合,然后执行如下操作进行转换:

  1. 对于类型为exist/not_exist的子查询条件,调用coalesce_same_exists_exprs函数对子查询进行合并;对于any/all类型的子查询,则调用coalesce_same_any_all_exprs函数进行合并。

  1. 调用get_remove_exprs函数对比合并前后的子查询集合,得到需要移除的子查询条件。

  1. 调用ObOptimizerUtil::remove_item函数进行子查询移除。

coalesce_same_exists_exprs函数会将待合并的子查询集合内进行两两对比,如果两个子查询条件是同一属性的谓词,则调用ObStmtComparer::check_stmt_containment函数判断子查询的包含关系。如果两个子查询存在包含关系,则根据语义将其中一个标记移除。

coalesce_same_any_all_exprs函数较为类似,故不再赘述。

不同类型子查询合并

transform_diff_exprs函数负责进行不同类型子查询合并,执行流程如下:

  1. 调用check_conditions_validity函数对子查询条件进行检查,判断是否满足冲突改写条件,同时收集可以合并的子查询供后续使用。

  1. 如果where或having中的子查询条件符合冲突改写的条件,将其改写为false表达式;如果不满足,则继续进行子查询合并。由于这项改写不一定能够产生更好的执行计划,因此这里会创建一个新的ObStmt对象用于存储转换后的结果,从而实现在改写完成后对比新旧计划的开销。子查询合并的执行流程如下:

  1. 调用coalesce_diff_exists_exprs函数对where中的exist/not_exist条件进行子查询合并。

  1. 调用coalesce_diff_any_all_exprs函数对where和having中的any/all条件进行子查询合并。

check_conditions_validity函数负责检查查询语句中是否存在可以合并的子查询条件。该函数会遍历所有可以可合并的子查询类型对,然后调用get_same_classify_exprs函数找到符合当前子查询类型对的两组子查询集合,在两组集合间进行两两对比判断子查询间的包含关系,最终确定是否满足冲突改写或子查询合并条件。

coalesce_diff_exists_exprs函数负责进行不同类型子查询的合并,该函数最终调用merge_exists_subqueries函数进行合并,执行逻辑如下:

  1. 创建一个新的子查询作为合并结果,复制exist子查询的内容至该查询。

  1. 遍历not_exist子查询的where条件,找出不在exist子查询中的查询条件。

  1. 添加not_exist子查询中不在exist子查询中的列到合并结果子查询中。

  1. 对2中的查询条件取反,添加到合并结果子查询的查询条件中,这里取反的方式为添加如下having条件:

having sum(case when conds then 1 else 0 end) = 0

coalesce_diff_any_all_exprs函数较为类似,区别在于取反的方式为添加如下lnnv表达式:

lnnv(conds)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值