9.1 关系数据库系统的查询处理
9.1.1 查询处理步骤
- 查询分析:词法分析、语法分析
- 查询检查:语义分析、是否有权限、是否破坏完整性、视图转换
- 查询优化:代数优化(逻辑优化)和物理优化(基于规则、代价、语义),生成查询计划树
- 查询执行:自底向上/自顶向下策略
9.1.2 实现查询操作的算法示例
- 选择操作的实现:全表扫描/索引扫描
- 连接操作的实现:查询处理中最常用最耗时的操作之一
- 嵌套循环算法:最简单最通用,实际上都是基于数据块的循环
- 排序-合并算法:常用与等值连接,尤其适合各个表已经排好序的情况。
第一步:如果参与连接的表没有排好序,根据连接属性排序
第二步:sorted_merge - 索引连接算法:根据表上已经建立好的索引,根据索引查找匹配的元组
- hash join 算法:等值连接,要求内存足够大,小表的hash表要全部能够放进内存。分成两个阶段
第一步,为小表建立hash表,根据连接属性作为hash码
第二步,对另外一张表的连接属性hash一遍,将匹配的元组连接起来