[笔记] 查询计划及其优化

最新推荐文章于 2024-10-08 17:39:57 发布

love is sour

最新推荐文章于 2024-10-08 17:39:57 发布

阅读量147

点赞数

分类专栏： # CMU15-445 数据库文章标签：数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/antio2/article/details/130010422

版权

数据库同时被 2 个专栏收录

12 篇文章 0 订阅

订阅专栏

8 篇文章 9 订阅

订阅专栏

查询优化概述

查询优化的两种方法：

Rules:通过静态的条件判断，来重写查询。通过查看catalog而不是数据。
Cost-based 枚举SQL的所有方案，并且预估成本然后选择成本低的。

查询优化的流水线

SQL Rewriter 对SQL语句进行重写标记上额外信息（可选）
Parser 进行编译，将sQL转化为语法树
Binder 将SQL引用的符号转化为内部标记。比如select * from foo,会通过字符串"foo"来寻找相应的表。
Logical Plan
Tree Rewiter通过查询system catalog来进行优化
进入Optimizer,计算成本模型
生成物理计划

逻辑计划和物理计划的区别：

逻辑计划生成关系代数表达式，物理计划使用具体的操作符，是实际执行的底层逻辑。逻辑计划和物理计划不一定一一对应。

优化方法

Predicate Pushdown,通过提前执行谓语（从语法树上往下推），来减少工作量

Selections：越早执行过滤操作越好。
Projections: 提早执行，来最小化要执行的元组数据。

单一关系模型

顺序查询
聚簇索引
索引扫描

首先判断是否sargable(Search Argument Able)是否又对应索引。

现在大多数DBMS采用heuristics(启发式)而不是精确的模型。

一个sargable的query能很容易被启发式的模型执行。

多个关系模型

可以枚举的：

操作顺序
操作的方法：比如hash、sort-merge、nested loop…
拿到数据的方法：Index#1、Index#2、Seq Scan…

随着join数量的增加，可行的所有方法也会增加，故不能使用枚举，要限制搜索的数量来在可接受的时间内找到优化的方案。

自底向上：从nothing逐渐构建方案。例子：IBM System R, DB2, MySQL, Postgres, most open-source DBMSs
自顶向下：从想要的结果开始，然后从语法树上到下优化。例子：MSSQL, Greenplum, CockroachDB, Volcano
遗传算法 PostgreSQL(GEQ)

自底向上优化：System R

研究

Home - Database of Databases (dbdb.io)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。