目录
五大策略
1.优化器自动优化
Apache Calcite是一个开源的SQL解析、优化和查询引擎框架。它提供了一套标准的SQL解析和优化接口,可以被其他系统集成以获得SQL处理能力。Flink SQL就是基于Calcite来实现其SQL功能的。
当用户提交一个SQL查询到Flink时,Flink会将其交给Calcite处理。Calcite的处理流程通常包括以下几个步骤:
-
SQL解析
Calcite首先会将SQL字符串解析成一棵抽象语法树(AST)。在这个过程中,它会检查SQL的语法是否正确,并将SQL中的标识符(如表名、列名等)解析成内部的数据结构。 -
语义分析
在语法分析之后,Calcite会进行语义分析。它会检查SQL中引用的表和列是否存在,表达式的类型是否正确等。语义分析的结果是一个合法的、类型检查通过的查询计划。 -
逻辑优化
语义分析后的查询计划会进入逻辑优化阶段。在这个阶段,Calcite会应用一系列的优化规则,对查询计划进行等价变换,以生成一个等价但更高效的查询计划。这些优化包括:
- 谓词下推:将过滤条件尽可能下推到离数据源最近的地方,以减少数据传输和处理。
- 列裁剪:去掉查询中未使用的列,以减少数据传输和处理。
- 常量折叠:预先计算常量表达式的值。
- 投影消除:去掉不必要