概述
Oceanbase在谓词移动规则中实现了谓词推导,该特性能够利用已有谓词推导出新的谓词,从而更加充分地利用索引并减少不必要的数据处理,提升查询性能。
基本原理
考虑如下情况:
SELECT max(a), b FROM t
WHERE a > b AND b = c AND c = d AND d >= 100 AND b like 'abc'
GROUP BY b
对于上述语句,可以按照如下流程进行谓词推导:
使用where条件中的简单谓词(>, >=, <, <=, =)的左右表达式建立n*n矩阵,并使用关系条件进行初始化,如下所示:
a | b | c | d | 100 | |
a | = | > | |||
b | = | = | |||
c | = | = | = | ||
d | = | = | >= | ||
e | = |
遍历矩阵中所有的三元组<left, mid, right>,利用如下关系传递规则进行推导:
相等传递:如果三元组满足left = mid && mid = right,则可以推出left = right。
大于等于传递:如果三元组满足left >= mid && mid = right,或者满足left = mid && mid >= right,则可以推出left >= right。
大于传递:如果三元组满足left > mid && (mid > right || mid = right || mid >= right),或者满足(left > mid || left = mid || left >= mid) && mid > right,则可以推出left > right。
根据上述规则,可以得到如下推导后的矩阵:
a | b | c | d | 100 | |
a | = | > | > | > | > |
b | = | = | = | >= | |
c | = | = | = | >= | |
d | = | = | = | >= | |
e | = |
基于上述矩阵,按照如下方式进行谓词扩展:
遍历矩阵,得到简单谓词,如下所示:
a > b AND a > c AND a > d AND a > 100
AND b = c AND b = d AND b >= 100
AND c = d AND c >= 100
AND d >= 100
如果原来的谓词集合中存在通用谓词(between, like, <>, in),则可以基于矩阵中的相等关系进行扩展,如下所示:
b <> 0 AND c <> 0 AND d <> 0
如果原来的select列中存在min/max聚合项,则可以基于矩阵中的不等关系进行扩展,如下所示:
SELECT max(d), e FROM t GROUP BY e
WHERE ...
HAVING max(d) >= e
注:这里推导having条件主要是用于构成父查询中的推导条件。
代码解析
谓词推导逻辑的入口为ObTransformPredicateMoveAround::transform_predicates,执行流程如下:
调用ObPredicateDeduce::add_predicate函数将原有谓词添加到推导对象中,用于构建表达式矩阵。
调用ObPredicateDeduce::deduce_simple_predicates函数从表达式矩阵中取出简单谓词。
调用ObPredicateDeduce::deduce_general_predicates函数,使用表达式矩阵进行通用谓词推导。
调用ObPredicateDeduce::deduce_aggr_bound_predicates,使用表达式矩阵进行聚合谓词推导。