数据库复习（8）查询优化

最新推荐文章于 2022-01-10 16:05:14 发布

StreakyPorker

最新推荐文章于 2022-01-10 16:05:14 发布

阅读量651

点赞数 2

分类专栏：数据库相关文章标签：数据库

本文链接：https://blog.csdn.net/weixin_44662670/article/details/107809645

版权

9 篇文章 7 订阅

订阅专栏

一、概述

一个执行计划确切地定义了每个运算应使用的算法以及它们之间的执行应该如何协调。查询优化器的任务是产生一个查询计划，与原关系表达式相同并且结果执行代价最小。
产生查询执行计划分3步走：

用 $\theta,\theta_1,\theta_2$ 代表为此， $L,L_1,L_2$ 代表属性列表， $E,E_1,E_2$ 代表关系代数表达式，r代表关系实例，可以出现在所有E出现的地方，则：

合取选择运算可分解为单个选择运算的序列。改变换被称为 $\sigma$ 的级联：
$\sigma_{\theta_1\land\theta_2}(E)=\sigma_{\theta_1}(\sigma_{\theta_2}(E))$
选择运算满足交换律（commutative）：
$\sigma_{\theta_1}(\sigma_{\theta_2}(E))=\sigma_{\theta_2}(\sigma_{\theta_1}(E))$
一系列投影运算中只有最后有一个运算时必须的，其余可省略，该转换也可被称为 $\prod_{}$ 的级联：
$\prod_{L_1}(\prod_{L_2}(...\prod_{L_n}(E)...))=\prod_{L_1}(E)$
选择操作可与笛卡儿积以及 $\theta$ 连接相结合
$\theta$ 连接运算满足交换律：
事实上如果考虑属性顺序时，这一条定律并不成立
自然连接运算满足结合律（associative）， $\theta$ 连接满足广义的结合律：

上面的式子事实上意味着笛卡尔积也满足结合律
选择运算在下面两个调剂按下对 $\theta$ 连接运算也具有分配律（选择的下沉）：
a. 当选择条件 $\theta_0$ 中的所有属性只涉及参与链接运算的表达式之一（比如 $E_1$ 时），满足分配律

b. 当选择条件 $\theta_1$ 只涉及 $E_1$ 的属性，选择条件 $\theta_2$ 只涉及 $E_2$ 的属性时，满足分配律：
投影运算在下面条件下对 $\theta$ 连接运算具有分配律：
集合的并与交满足交换律，单集合的差不满足交换律
集合的并于交满足结合律
选择运算对并、交、差运算具有分配律：
投影运算对并运算具有分配律。

数据库系统同目录存储了有关数据库关系的下列统计信息：

$n_r$ ，关系r的元组数
$b_r$ ，包含关系r中元组的磁盘块数
$l_r$ ，关系r中每个元组的字节数
$f_r$ ，关系r的块因子，也即一个磁盘块中能容纳关系r中元组的个数
$V (A, r)$ ，关系r中属性A中出现的非重复值个数。该值与 $\prod_A(r)$ 的大小相同，如果A式关系r的主码，则 $V (A, r)$ 等于 $n_r$ 。
需要的话，V(A,r)可以针对某个属性集，而非单独的属性来维护。

延申：如果假设关系r的元组在物理上存储于一个文件中，则有 $b_r=\lceil \frac{n_r}{f_r}\rceil$ 成立。
另外，关于索引的统计信息，如B+树索引的高度和索引中叶节点的页数，也保存在目录中。

选择操作	分析	结果
$\sigma_{A=a}(r)$	假设每个值出现概率相等，则结果应该与元组数正比，与重复值数量呈反比	$n_r/V(A,r)$
$\sigma_{A\leq v}(r)$	如果统计信息中保留了A属性下的最小值min(A,r)和最大值max(A,r)，可以进行更精确的判断	$0\ for\ v\leq min(A,r,\\n_r\ for\ v\geq max(A,r),\\ n_r\cdot \frac{v-min(A,r)}{max(A,r)-min(A,r)}\ otherwize.$
$\sigma_{\theta_1\land...\land\theta_n}(r)$	对每一个合取项，将 $\sigma_{\theta_i}(r)$ 的大小记为 $s_i$ ，那么某一个元组存在于这个自己的概率是 $\frac{s_i}{n_r}$ ,那么如果这n个选择是互相独立的，满足所有合取项选择的概率就是所有上述概率的乘积
$\sigma_{\theta_1\vee...\vee\theta_n}(r)$	析取项与合取项类似，整体取反后每项取反即可得到
$\sigma_{\neg\theta}(r)$	如果null值不存在，结果就是总数减去正选择的数量	$n_r-size(\sigma_\theta(r))$

笛卡尔积 $r\times s$ 包含 $n_r*n_s$ 个元组，而每个元组占用 $l_r+l_s$ 个字节，因此可计算出笛卡尔积的大小。
更难以估算的是自然连接的大小，需要分情况讨论，令 $r (R)$ 和 $s (S)$ 为两个关系：

在这里插入图片描述

对于所有的 $\theta$ 连接，对于估计上的方法与执行策略无关，直接将其化为 $\sigma_\theta(r\times s)$ ，对一次选择和一次笛卡尔积做估计即可。

操作名称	描述	结果
$\prod_A(r)$	去除了重复元组	$V (A, r)$
$_A\mathcal{G}_F(r)$	对A的任意一个不同取值在其中总有且只有一个元组与其对应	$V (A, r)$
集合运算	将所有的几个运算携程关系谓词的合取/析取形式

关注