第九章 关系查询处理和查询优化

关系数据库系统的查询处理

查询处理步骤
关系数据库管理系统查询处理阶段 :
1.查询分析
2.查询检查
3.查询优化
4.查询执行

实现查询操作的算法示例
1.选择操作的实现
选择操作典型实现方法:
(1) 全表扫描方法 (Table Scan)
(2)索引扫描方法 (Index Scan)

2.连接操作的实现

关系数据库系统的查询优化
查询优化概述
关系系统的查询优化
是关系数据库管理系统实现的关键技术又是关系系统的优点所在
减轻了用户选择存取路径的负担
关系数据库管理系统通过某种代价模型计算出各种查询执行策略的执行代价,然后选取代价最小的执行方案
集中式数据库
执行开销主要包括
磁盘存取块数(I/O代价)
处理机时间(CPU代价)
查询的内存开销
I/O代价是最主要的 
分布式数据库
总代价=I/O代价+CPU代价+内存代价+通信代价
查询优化的总目标
选择有效的策略
求得给定关系表达式的值
使得查询代价最小(实际上是较小)

一个实例
1.第一种情况
Q1=πSname(σStudent.Sno=SC.Sno∧SC.Cno=‘2’ (Student×SC))
(1) 计算广义笛卡尔积
(2)作选择操作
(3)作投影操作
2.第二种情况
Q2=πSname(σSc.Cno=‘2’ (Student SC))
(1)计算自然连接
(2)读取中间文件块,执行选择运算,读取的数据块=
103 块
(3)把第2步结果投影输出。
3.第三种情况
Q3=πSname(Student σSC.Cno=‘2’(SC))
(1)先对SC表作选择运算,只需读一遍SC表,存取
100块,因为满足条件的元组仅50个,不必使用中
间文件。
(2)读取Student表,把读入的Student元组和内存中
的SC元组作连接。也只需读一遍Student表共100
块。
(3)把连接结果投影输出
代数优化
关系代数表达式等价变换规则
代数优化策略:通过对关系代数表达式的等价变换来提高查询效率
关系代数表达式的等价:指用相同的关系代替两个表达式中相应的关系所得到的结果是相同的
两个关系表达式E1和E2是等价的,可记为E1≡E2
常用的等价变换规则:
1.连接、笛卡尔积交换律
2.连接、笛卡尔积的结合律
3.投影的串接定律
4.选择的串接定律
5.选择与投影操作的交换律

①、选择与笛卡尔积的交换律

②、选择与并的分配律

③、选择与差运算的分配律

④、选择对自然连接的分配律

⑤、投影与笛卡尔积的分配律

⑥、投影与并的分配律

⑦、查询树的启发式优化
⑧、典型的启发式规则
(1)选择运算应尽可能先做
在优化策略中这是最重要、最基本的一条。
(2)把投影运算和选择运算同时进行
如有若干投影和选择运算,并且它们都对同一个关系操作,则可以在扫描此关系的同时完成所有的这些运算以避免重复扫描关系。
(3) 把投影同其前或其后的双目运算结合起来,没有必要为了去掉某些字段而扫描一遍关系。
(4) 把某些选择同在它前面要执行的笛卡尔积结合起来成为一个连接运算,连接特别是等值连接运算要比同样关系上的笛卡尔积省很多时间。
(5) 找出公共子表达式
如果这种重复出现的子表达式的结果不是很大的关系
并且从外存中读入这个关系比计算该子表达式的时间少得多
则先计算一次公共子表达式并把结果写入中间文件是合算的。
当查询的是视图时,定义视图的表达式就是公共子表达式的情况
-优化的一般步骤
(1)把查询转换成某种内部表示
1)FROM STUDENT,SC ≡ STUDENT×SC
2)σ STUDENT.SNO=SC.SNO ∧ SC.CNO=‘2’ (STUDENT×SC)
3)SELECT SNAME≡∏SNAME

物理优化
代数优化改变查询语句中操作的次序和组合,不涉及底层的存取路径
对于一个查询语句有许多存取方案,它们的执行效率不同, 仅仅进行代数优化是不够的
物理优化就是要选择高效合理的操作算法或存取路径,求得优化的查询计划

物理优化方法
基于规则的启发式优化
基于代价估算的优化
两者结合的优化方法

基于启发式规则的存取路径选择优化
1.选择操作的启发式规则
对于小关系,使用全表顺序扫描,即使选择列上有索引
对于大关系,启发式规则有:
(1)对于选择条件是“主码=值”的查询
(2)对于选择条件是“非主属性=值”的查询,并且选择列上有索引
(3)对于选择条件是属性上的非等值查询或者范围查询,并且选择列上有索引
(4)对于用AND连接的合取选择条件
(5)对于用OR连接的析取选择条件,一般使用全表顺序扫描
2.连接操作的启发式规则
(1)如果2个表都已经按照连接属性排序
选用排序-合并算法
(2)如果一个表在连接属性上有索引
选用索引连接算法
(3)如果上面2个规则都不适用,其中一个表较小
选用Hash join算法
(4)可以选用嵌套循环方法,并选择其中较小的表,确切地讲是占用的块数(b)较少的表,作为外表(外循环的表) 。
 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值