一、关系数据库系统的查询处理
查询优化分类 :
代数优化:指关系代数表达式的优化
物理优化:指存取路径和底层操作算法的选择
1.1 查询处理步骤
关系数据库管理系统查询处理阶段 :
1. 查询分析
2. 查询检查
3. 查询优化
4. 查询执行
1.2 实现查询操作的算法示例
1.选择操作的实现
(1) 全表扫描方法 (Table Scan)
对查询的基本表顺序扫描,逐一检查每个元组是否满足选择条件,把满足条件的元组作为结果输出
适合小表,不适合大表
(2)索引扫描方法 (Index Scan)
适合于选择条件中的属性上有索引(例如B+树索引或Hash索引)
通过索引先找到满足条件的元组主码或元组指针,再通过元组指针直接在查询的基本表中找到元组
2.连接操作的实现
连接操作是查询处理中最耗时的操作之一
(1)嵌套循环算法(nested loop join)
(2)排序-合并算法(sort-merge join 或merge join)
(3)索引连接(index join)算法
(4)Hash Join算法
二、关系数据库系统的查询优化
2.1查询优化概述
关系数据库管理系统通过某种代价模型计算出各种查询执行策略的执行代价,然后选取代价最小的执行方案
(1)集中式数据库
执行开销主要包括
磁盘存取块数(I/O代价)
处理机时间(CPU代价)
查询的内存开销
其中,I/O代价是最主要的
(2)分布式数据库
总代价=I/O代价+CPU代价+内存代价+通信代价
v代数优化改变查询语句中操作的次序和组合,不涉及底层的存取路径
v物理优化就是要选择高效合理的操作算法或存取路径,求得优化的查询计划