第7章-查询优化（金培权课程）

最新推荐文章于 2025-10-19 21:39:30 发布

原创最新推荐文章于 2025-10-19 21:39:30 发布 · 825 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#数据库

数据库专栏收录该内容

8 篇文章

订阅专栏

本文介绍SQL查询优化的关键步骤，包括语法分析、逻辑查询计划生成及优化等，并探讨了查询代价估计的方法，如中间结果大小和I/O代价的估算。

查询优化

语法分析
- SQL查询语法分析
- 初始逻辑查询计划生成
查询重写
转换规则
查询代价估计
- 中间结果的大小估计
- IO代价估计

语法分析

构造语法分析树

SQL查询语法分析

在这里插入图片描述

初始逻辑查询计划生成

关系代数
关系代数与SQL语句的转化

查询重写

初始逻辑查询计划->优化的逻辑查询计划
在这里插入图片描述

转换规则

$R \times S = S \times R$ ; $(R \times S) \times T = R \times (S \times T)$ ;
$R\Join S=S\Join R$ ; $(R\Join S)\Join T= R\Join (S\Join T)$
$R\cup S= S\cup R$ ; $(R\cup S)\cup T=R\cup (S\cup T)$
$R\cap S= S\cap R$ ; $(R\cap S)\cap T=R\cap (S\cap T)$
$\sigma_{c1\land c2}(R)=\sigma_{c1}(\sigma_{c2}(R))$
$\sigma_{c1\lor c2}(R)=\sigma_{c1}(R)\cup_s \sigma_{c2}(R)$
$\sigma_{p}(R\Join S)=\sigma_p(R)\Join S$ ; $\sigma_{p}(R\Join S)=R\Join \sigma_p(S)$ ;
$\sigma_{p\land q}(R\Join S)=\sigma_p(R)\Join \sigma_q(S)$
$\sigma_{p\land q\land t}(R\Join S)=\sigma_p(\sigma_q(R)\Join \sigma_t(S))$
$\sigma_{p\lor q}(R\Join S)=\sigma_p(R\Join S)\cup \sigma_q(R\Join S)$
$\pi_{xy}(R\Join S)=\pi_{xy}(\pi_{xz}(R)\Join\pi_{yz}(S))$
注意对于不同顺序的 $\Join$ 他们导致的中间代价不同
在这里插入图片描述
SQL中的Union All和Union的区别：Union All不去重不排序，Union去重且排序

查询代价估计

中间结果的大小估计

统计量
T®：R的元组个数
S®：R的每个元组大小（bytes）
V(R,A)：R的属性A的不同取值个数
B®：容纳R的所有元组所需的块数

	T(W)	S(W)
W=R1×R2	T(R1)*T(R2)	S(R1)+S(R2)
W= $\sigma_{A=a}(R)$	$T (R) / V (R, a)$	$S (R)$
W= $\sigma_{z>val}(R)$	$T (R) / 2$ 或者通过取值范围进行估计	$S (R)$
W= $\sigma_{z!=val}(R)$	$T (R) (1 - 1 / V (R, z))$	$S (R)$
$W=R\Join S$ （R与S的共同属性为A）	$T (R) * T (S) / m a x (V (R, A), V (S, A))$	$S (R) + S (S) - S (A)$