oracle where in优化,查询优化 In Oracle

Cost-based query transformation in Oracle

Enhanced Subquery Optimizations in Oracle

Cost-based query transformation in Oracle

本文介绍Oracle的查询优化框架,

先描述,Oracal分别在RBO和CBO做了哪些事情,为什么要这样做

Heuristic Transformation

先看下RBO的部分,RBO部分的Rule基本都是确定可以带来优化的

Subquery Unnesting

子查询消除,子查询如果用apply的方式的话,文中称TIS,Tuple iteration semantics,基本等同于nested loop方式,比较低效

消除的方法分成两大类,

1. 把子查询 merge 到外部查询里面去

如下面的例子,把exists变成semi-join

9e5c59f1726c01a7705b630005a5354b.png

5fd4388bcae942fac6375ce56650ce2e.png

2. 产生inline views,或derived table的方式,这种方式会放到CBO里面,所以后面给出例子

Join Elimination

消除无用的Join

其中Q4,dept_id是foreign key,所以每个employee都必须有一个dept,这里join起不到filter的作用

8887b9b215a700ecabe02fedb591b6ba.png

7de316a37692c1a6a08908d64d24dd94.png

Filter Predict Move Around

Filter下推,尽早的过滤数据,前提是这里的Filter是inexpensive的

5294ac3439189462c34f89e9279654af.png

Group Pruning

删掉在外层查询中不需要的group

下面的例子,在外层查询中,过滤city,那么city其实就决定了state,country,子查询中的group by 就没有必要了

d13067424236f99586e45bee0145ef3d.png

Cost-Based Transformations

这里讲到重点,看下哪些Transformation应该在CBO里面去做的

Subquery Unnesting

第一个仍然是子查询消除,前面说了,如果是产生inline view的方式,需要用CBO

下面的例子,从Q1到Q10,产生了inline view或派生表 V

db7bcee59d04c51f27f4cadf8cfda985.png

0a7bd71e66520824d75bc0c50126379a.png

这里产生inline view的方式不一定会比nested loop的方式更好,如果filter出的row很少,而索引建的很好,很可能nested loop的方式更优

099a63094c7d5b992c53224b6bf409d7.png

所以这种不确定的情况下,需要CBO来判断

Group-by and Distinct View Merging

右称为,Groupby Pull-up,如果join会大幅降低数据量,那么把groupby上提是核算的,因为groupby一般都是聚合,比较expensive的操作

比如下面Q11的例子,

把计算平均salary的inline view,挪到了外部查询的group by

可以看到把group by移到外面后,group by的field需要加上join key

4a7c8ada890b4aa6731e0368d813b164.png

5216993ae9e355f1cd8695ddb6f7d428.png

Group-by Placement

对应于上面说的Pull Up,这里是Push Down

4b0fd38e7fd25d7fa3b99ebedb6d7306.png

Join Predicate Pushdown

把外部查询的join predicate下推到子查询中,

一般套路都是uncorrelation,这里反之,不是所有情况都可以这样下推

a390b4d5c6da825229bca15800966b90.png

例子,

6d7fe8cc96e1d7991a114472ee1aa684.png

7e908c2a357e685736c5d13ff15daea3.png

Join Factorization

将公共的 join tables 上提

9d04b562539caad019ff12ccc35ecf81.png

f5a981053fc589814a84fda9c56c0d1a.png

Predicate Pullup

将Expensive的Predicate进行上提,

37498d7b07ee15e86c2465e730c0492d.png

Set Operator Into Join

e6a83b75e36a83b31f597499b2c659b9.png

Disjunction Into Union All

dc1c6ad001b121ae060651914e95b8e1.png

Framework For Cost-based Transformation

State Space Search Tech

CBO有个关键的问题是,如果Transformation持续变多,那么搜索空间是成指数级别上升的

a926878282b29dcc927113afc9a35db6.png

针对这样的问题,比较可行的方式是引入随机算法,

66ce1153c230de97b9ceda6ac812b222.png

Oracle的搜索算法如下,

Exhaustive,穷尽法

Iterative,局部最优,每次选择不同的初始点,有点像退火

Linear,动态回归

Two-pass,强行降低搜索空间

25f5ff123b23ba2cee10d222988e5aca.png

e227d5f11f448fb120c3ee758f520b67.png

然后这里比较有借鉴意义,针对不同的search规模,我们应该选用不同的搜索算法

a3bc376d1bd8c639767b25f5e766871b.png

Transformation执行的方式

Oracle中按照顺序的方式去执行Transformations,

这里给出各个分类的执行顺序

7d4a2d8da86685ab6b912e1fc3d6a77c.png

当然有些情况下光顺序执行是不够的,

3.3里面提到了,

Interleaving方式,有些rule需要交叉的执行

90fa8d29b49e055b5cb0504c0711ea2a.png

举得例子是,Unnesting和View merging

cf2ae8aaf6114641be5ea1ec4e0bfb20.png

Juxtaposition的方式,

ce5b81d314fe6f4a6e825e763d803d6e.png

Enhanced Subquery Optimizations in Oracle

本文讨论Oracle对于子查询的优化方法

Subquery Coalescing

子查询合并,把多个子查询合并成一个

这里提出,Container和Contained的概念

直观上,如果A contain B

A and B,就可以remove A

A or B,就可以removeB

923dc4217b07c1374e4b8036f4d4b180.png

Coalescing Subqueries of The Same Type

SameType,类型一样,要不都是Exist,要不都是Not Exist

和上面说的一致,只是这里加上Exist和Not Exist,有点绕

总之conjunction留小的,contained,disjunctive留大的,container

3c2025f370036f0b1aab7926dba30007.png

对于不满足Containment Property的子查询,仍然可能进行coalescing,

只要他们除了filter和predicates以外是equivalent的

这个很直观,因为如果只是Predicate不一样,是可以合并的

d7e7fe4a95f5762f9d88a3c157333630.png

例子,虽然没有containment关系,但是仅仅只有predict不一样

a507e39c579e47de737dd181ed4cf682.png

可以看到,可以直接把Exists间的OR,转化为predict之间的OR,很直觉

6f045f613f6b0cc73d7a5ff43adf1984.png

Coalescing Subqueries of Different Type

不同的Type,Exist和Not Exist之间的

可以看TPC-H的Q21,

两个子查询是满足Containment关系的,但是类型不一样

这里的感觉就要从Container中挖去Contained的那块

8beed6c62b670622a91020678213d945.png

是这样转换的,

用Having,对满足条件的case求sum,然后过滤,好tricky

86c776b77bda06b80ea388f5cc6f9e59.png

Coalescing and Other Transformations

Q5加上外层的Join就是Q6

3cadf70d2408c6c38c547fe11596e5d1.png

这里做的转换是,View merging,就是Groupby Pullup

但是GroupBy的Pull up还是Push down,需要通过cost-based来决定

a7cc65af894e0116a85f4e5f9eba0cc7.png

Subquery Removal Using Window Functions

Oracle有窗口函数,可以用于替换子查询,论文里说,对于TCP-H,性能会有10倍提升

这里有subsume的概念,outer query包含子查询中的所有tables和predicates

f82f2e56cda909aebed234ac0a6c94a3.png

这个例子,满足Subsume关系,在子查询中主要为了做AGG

251488a0c6f5912a63ad829cc9054a3d.png

所以这里用窗口函数就可以简单的remove掉子查询

74c5f09ecbf330dfb0dae25c906a180f.png

Correlated Subsumed Subquery

相关子查询,在TCP-H中的代表是Q2,Q17

Q2,子查询中主要为了求min

6cdc6cd1595f46c1b958908a900ec2ae.png

960c43ddafad40c642c5da4ffb1175ff.png

用窗口函数,改造后

31be358dd02f45b51746c62b5aaf0766.png

对于Q17,微软提出的是SegmentApply的方案,这里用窗口函数改造后,

底下关于Duplicate rows,没太懂

说是窗口函数必须within a view,没看出和上面的区别

6ebcbca262fa52c2dd49c6a659fc3ad4.png

Uncorrelated Subsumed Subquery

非相关子查询,TCP-H,Q15

dcc449546af413c3843c9e398af6ba1b.png

5b22afb949582751d2275af7c12088ec.png

用窗口函数转化为,因为是非相关子查询,所以OVER里面是空的,不需要PBY

f1230950fbc453c4bdef94617101d3e6.png

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值