理论先行
- postgresql执行SQL语句时,首先通过语法分析模块(词法分析、语法分析(语法树)、语义分析(查询树)),然后通过查询优化器进行逻辑优化和物理优化,生成计划树,就是执行计划。
- 逻辑优化: 是基于规则的优化,对SQL进行重写。比如谓词下推,连接顺序交换等。
- 物理优化:是基于代价的优化,数据库建立了各种代价模型,对各种物理路径进行代价的评估,选择一条代价相对较低的执行。物理路径包括扫描路径、连接路径等。
- 代价计算: 代价的计算需要用到统计信息和选择率。统计信息记录了表内数据的抽样信息,定期进行统计。根据统计信息,数据库可以计算出一个约束条件可以过滤掉多少数据,计算出选择率。根据选择率可以得到各种物理路径的代价。
- 连接路径: 嵌套循环连接、哈希连接、归并连接。
查询类语句的处理
postgresql对查询类语句的优化过程,除了语法分析过程和词法分析过程以外还需进行:
-
将原始语法树转换为查询语法树;
-
以查询语法树为基础对其进行逻辑优化;
-
对查询语句进行物理优化;
-
查询计划创建等过程。
具体流程介绍
根据本人知识沉淀以及相关资料的查阅,以下提供各位本人对查询类语句优化过程的理解
(1)将原始语法树转换为查询语法树
经过词法分析和语法分析后,postgresql需要将原始语法树转换为查询语法树并在转换过程中进行语义方面合法性检查。例如基表的有效性检