第九章.关系查询处理和数据优化
1. 查询处理的任务:把用户提交给数据库管理系统的查询语句转换为高效的查询执行计划
2. 查询处理步骤:查询分析、查询检查、查询优化、查询执行
3. 选择操作的算法:1.简单的全表扫描 2.索引扫描
4. 连接操作的算法:1.嵌套循环 2.排序-合并 3.索引连接 4.hash join
5. 查询优化的原因和目标
- 原因:关系查询优化是影响数据库管理系统性能的关键因素
- 优点:用户不别考虑如何最好地表达查询以获得较高的效率、系统可以比用户的优化做的更好
- 目标:选择有效的策略,求得给定的关系表达式的值,使得查询代价较小
查询代价:I/O代价 + CPU代价 + 内存代价 + 通信代价
主要考虑I/O,其他相对不可控
**6.**查询优化:一般分为代数优化和物理优化
7. 代数优化:通过关系代数表达式的等价变换来提高查询效率
查询树的启发式优化:
- 选择运算尽可能先做
- 投影和选择同时进行
- 投影同其前或后的双目运算结合
- 某些选择同它前面要执行的笛卡尔积结合起来成为一个连接运算
- 找出公共子表达式-先保存起来
8. 物理优化:选择高效合理的操作算法或存取路径
方法:
- 基于规则的启发式优化(选择操作、连接操作的规则)
- 基于代价估算的优化
- 两者结合