openGauss内核分析（八）：执行算子探究

最新推荐文章于 2024-05-20 14:57:04 发布

飞奔的数据库

最新推荐文章于 2024-05-20 14:57:04 发布

阅读量132

点赞数

文章标签：数据库开源

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gallopingdb/article/details/131965257

版权

openGauss内核分析（八）：执行算子探究

执行引擎位于优化器和存储引擎之间，负责将数据从存储引擎读取出来，根据计划将数据处理加工返回给客户端。执行器接收到的指令就是优化器应对SQL查询而翻译出来的关系代数运算符所组成的执行树，如下图所示：

图中每一个方块代表一个具体关系运算代数符，我们称之为算子，每个算子有统一的接口，从下层的一个或者多个算子获得输入，然后将运算结果返回给上层算子。整个查询执行过程主要是两个流，驱动流和数据流。

向上的流代表数据流，是指下层算子将数据返回给上层算子的过程，这是一个从下至上、从叶节点到跟节点的过程。在openGauss中，所有的叶子节点都是表数据扫描算子，这些节点是所有计算的数据源头。数据从叶子节点，通过逐层计算，然后从根节点返回给用户。
向下的流代表控制流，是指上层算子驱动下层算子执行的过程，这是一个从上至下、由根节点到叶节点的过程。从代码层面来看，即上层算子会根据需要调用下层算子的函数接口，去获取下层算子的输入。驱动流是从根节点逐层传递到叶子节点。

执行器的整体目标就是在每一个由优化器构建出来的执行树上，通过控制流驱动数据流在执行树上高效的流动，其流动的速度决定了执行器的处理效率。

算子分类

关系数据库本身是对关系集合Relation的运算操作，执行引擎作为运算的控制逻辑主体也是围绕着关系运算来实现的，在传统数据库实现理论中，算子的分类可以分成以下几类：

扫描算子（Scan Plan Node）

扫描节点负责从底层数据来源抽取数据，数据来源可能是来自文件系统，也可能来自网络（分布式查询）。一般而言扫描节点都位于执行树的叶子节点，作为执行树PlanTree的数据输入来源。

关键特征：输入数据、叶子节点、表达式过滤

控制算子（Control Plan Node）

控制算子一般不映射代数运算符，通常是为了执行器完成一些特殊的流程引入的算子。

最低0.47元/天解锁文章

飞奔的数据库

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。