SQL查询计划（Query Plan）处理模型（processing model）

最新推荐文章于 2024-08-23 17:23:11 发布

KD_

最新推荐文章于 2024-08-23 17:23:11 发布

阅读量1.4k

点赞数

分类专栏：数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41775852/article/details/115145802

版权

数据库专栏收录该内容

18 篇文章 2 订阅

订阅专栏

本文探讨了数据库执行引擎的两种重要技术——向量化执行和编译执行。向量化执行利用CPU流水线并批量处理数据，减少缓存丢失，适合大数据量处理；而编译执行通过Codegen技术将运算编译为函数，利用寄存器计算，提高效率，但不适用于小规模OLTP场景。两者各有优缺点，在实际应用中需根据场景选择合适策略。

摘要由CSDN通过智能技术生成

https://www.iteblog.com/archives/9806.html

迭代模型（火山模型）

在这里插入图片描述

物化模型

在这里插入图片描述

向量化执行

在这里插入图片描述

编译执行

编译执行基本做法是使用Codegen 技术，将所有的算子编译成一个函数，通过PUSH 的模型自下而上通过数据上推完成计算。典型的代表产品有Spark 和 Peloton。

在这里插入图片描述

向量化执行和编译执行的比较

参考：
云原生数据仓库TPC-H第一背后的Laser引擎大揭秘
 Spark代码生成-全阶段代码生成

向量化执行
优点：

充分发挥CPU 的流水线执行（不会出现大量虚函数调用）
内存的顺序访问，减少cache的miss（一次缓存多条记录在内存中）

缺点：

实现逻辑比较复杂
需要批量的数据，并不适合每次计算数量较小的OLTP 场景
需要缓存批量数据，缓存本身带来一定的内存开销。

编译执行
优点：

充分发挥CPU 的流水线执行（不会出现大量虚函数调用）
由于每次计算的都是一行数据，执行过程可以将这一行数据保存在寄存器里面，寄存器计算代替内存计算
由于每次计算的都是一行数据，执行过程可以将这一行数据保存在寄存器里面，寄存器计算代替内存计算

缺点：

PUSH 模型控制逻辑比较复杂
由于采用单条计算，无法做到内存的顺序访问，所以它整体的Cache miss 率比较高

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

KD_ CSDN认证博客专家 CSDN认证企业博客

码龄7年

68: 原创

31万+: 周排名

109万+: 总排名

12万+: 访问

: 等级

1312: 积分

33: 粉丝

88: 获赞

37: 评论

367: 收藏

私信

关注

热门文章

分类专栏

数据库 18篇
分布式系统 18篇
数据仓库 3篇
java 10篇
操作系统 8篇
MQ 1篇
HBase 2篇
Spark 25篇
计算机 1篇
空间索引 2篇
计算机网络 1篇
hadoop 1篇
算法 1篇
zookeeper 2篇
Kafka 2篇
Maven 1篇
pzx 2篇

最新评论

分布式系统一致性和共识
Shady23333: 什么叫所有进程感知到的写操作顺序是一样的，完全不理解，太抽象了
GeoSpark 介绍与解析
m0_74097056: geospark在哪下载安装包啊,网上甚至linux安装配置都没有
并发编程 - lost wakeup
KD_: 你说的sleep应该改是java里面的Thread.sleep方法，确实不会释放锁。这里sleep指的是操作系统层面的线程挂起
并发编程 - lost wakeup
bxm623: "sleep方法调用时释放锁",sleep不是不会释放锁的么？
Spark --files理解
m0_37651941: 这样也没法获取

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。