openLooKeng新下推框架的介绍与实践

最新推荐文章于 2024-05-01 22:40:24 发布

openLooKeng

最新推荐文章于 2024-05-01 22:40:24 发布

阅读量590

点赞数

分类专栏：大数据大数据技术文章标签： java 大数据

本文链接：https://blog.csdn.net/openLooKeng/article/details/116497988

版权

本文介绍了openLooKeng的新下推框架，旨在解决原有基于Rule的下推方案的局限性，如无法处理JoinNode等。新框架允许connector提供基于visitor模式的PlanOptimizers，实现更灵活的优化。通过暴露子执行计划给connector并限制仅优化所属子树，新框架可以更高效地将操作下推到数据源，充分利用数据源能力。此外，还展示了如何为connector添加connectorPlanOptimizer的步骤，并提供了示例演示。

摘要由CSDN通过智能技术生成

openLooKeng执行计划优化简介

在讲述下推框架之前，我们先来简单介绍一下openLooKeng执行计划优化的大致流程。

如上图所示，接收到用户SQL语句之后，SQL被转换成一个Abstract syntax tree (AST)树。AST树再被转换成逻辑执行计划树。然后，也就是执行计划优化过程中最重要的一步，使用规则（Rule）或者优化器（Optimizers）进行执行计划优化，每一个PlanOptimizer可以操作一个子执行计划树，PlanOptimizer基于统计或者经验，用一个更优的子执行计划替换当前的子树，达到优化的目的。PlanOptimizers通常是长期的经验累积得出来的一些优化规则，比如谓词下推、join reorder等等。PlanOptimizers可以存储一些物理执行信息在ConnectorHandle中。新下推框架则工作在这一层。

得到最优的执行计划之后，逻辑执行计划被转换成物理执行计划，然后被分片，分割成按照stage执行的一个个子树，最终调度到worker上执行。