Oceanbase查询改写：子查询合并

飞驰人生2023

已于 2023-03-02 14:53:19 修改

阅读量356

点赞数

分类专栏： Oceanbase笔记文章标签： oceanbase 数据库架构数据库 database sql Powered by 金山文档

于 2023-03-01 17:02:58 首次发布

本文链接：https://blog.csdn.net/weixin_64863780/article/details/129285490

版权

Oceanbase笔记专栏收录该内容

23 篇文章 2 订阅

订阅专栏

概述

当SQL中存在多个子查询条件时，查询性能往往会受到较大影响。为此，Oceanbase中定义了子查询合并规则，能够将满足条件的多个子查询进行合并，从而减少不必要的子查询，提升查询性能。

基本原理

子查询合并规则主要包含对以下两种情况的处理：

同类型子查询合并：当查询语句中存在多个同类型（如同为exist或any类型）的子查询条件，且子查询的返回结果间存在包含关系时，可以移除多余的子查询。

不同类型子查询合并：当查询语句中存在多个满足特定组合（exist/not_exist，any/all）的子查询条件，且子查询的返回结果间存在包含关系时，对组合内的子查询进行合并。

不同类型子查询合并

不同类型子查询合并主要分为两种情况：

冲突改写：对于组合中的子查询条件，如果子查询的返回结果间存在包含关系，且子查询条件间存在语义上的冲突时，将其改写为false表达式。

子查询合并：对于组合中的子查询条件，如果子查询的返回结果间存在包含关系，且子查询条件不存在语义上的冲突时，将它们合并成为一个子查询条件。

冲突改写

考虑如下情况：

SELECT * FROM t1 WHERE EXIST (SELECT 1 FROM t2 WHERE c1 = 0)  --子查询1
         AND NOT EXIST (SELECT 1 FROM t2)                      --子查询2

上述例子中存在两个子查询条件，分别为exist子查询和not_exist子查询条件，其中子查询1的返回结果是子查询2返回结果的子集。可以看出，当子查询1为true时，子查询2必为false，因此可以将子查询条件改为false表达式，如下所示：

SELECT * FROM t1 WHERE false

子查询合并

接下来再考虑另一种情况：

SELECT * FROM t1 WHERE EXIST (SELECT 1 FROM t2)           --子查询1
      AND NOT EXIST (SELECT 1 FROM t2 WHERE c2 = 0)      --子查询2

与上一种情况不同的是，子查询2的返回结果变成了子查询1返回结果的子集。基于关系代数转换，可以将子查询2合并到子查询1中，得到等价的查询条件，如下所示：

SELECT * FROM t1 WHERE EXIST (SELECT 1 FROM t2 WHERE c2 <> 0)

代码解析

子查询合并规则的入口为ObTransformSubqueryCoalesce::transform_one_stmt，该函数的主要执行流程如下：

调用transform_same_exprs函数对where和having部分的查询条件进行同类型子查询的合并处理。

调用transform_diff_exprs函数对where和having部分的查询条件进行不同类型子查询的合并处理。由于该转换并不一定总能产生更好的执行计划，因此在转换结束后需要调用accept_transform函数判断是否应该保留本次转换结果。

不同类型子查询合并

transform_diff_exprs函数负责进行不同类型子查询合并，执行流程如下：

调用check_conditions_validity函数对子查询条件进行检查，判断是否满足冲突改写条件，同时收集可以合并的子查询供后续使用。

如果where或having中的子查询条件符合冲突改写的条件，将其改写为false表达式；如果不满足，则继续进行子查询合并。由于这项改写不一定能够产生更好的执行计划，因此这里会创建一个新的ObStmt对象用于存储转换后的结果，从而实现在改写完成后对比新旧计划的开销。子查询合并的执行流程如下：

调用coalesce_diff_exists_exprs函数对where中的exist/not_exist条件进行子查询合并。

调用coalesce_diff_any_all_exprs函数对where和having中的any/all条件进行子查询合并。

check_conditions_validity函数负责检查查询语句中是否存在可以合并的子查询条件。该函数会遍历所有可以可合并的子查询类型对，然后调用get_same_classify_exprs函数找到符合当前子查询类型对的两组子查询集合，在两组集合间进行两两对比判断子查询间的包含关系，最终确定是否满足冲突改写或子查询合并条件。

coalesce_diff_exists_exprs函数负责进行不同类型子查询的合并，该函数最终调用merge_exists_subqueries函数进行合并，执行逻辑如下：