「分布式技术专题」两种向量化执行引擎的实现方法

最新推荐文章于 2024-04-25 22:06:03 发布

国产数据库Hubble

最新推荐文章于 2024-04-25 22:06:03 发布

阅读量807

点赞数 1

分类专栏：分布式技术专题文章标签：分布式数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_51698806/article/details/113757478

版权

向量化执行引擎

在三种常见的数据库查询引擎执行模型中我们讲到了向量化执行引擎本质上是一种批处理模型。批处理思想在计算机的世界里经常闪闪发光。高并发场景中，可以把大量的请求合并，改为调用批量接口；大数据下读取分布式文件系统时，如果要读取大量的小文件，可以将这些小文件打成tar包，或者批量一次打开100~500个文件；数据库插入数据时，修改单条插入为批量插入等。批处理减少了cpu的中断次数，可以更加合理的利用资源。

在向量化执行引擎模型中，列式存储占据着天然的优势：

1、压缩能力的提升。同一列的数据类型相同，压缩比高。

2、IO总量小。压缩减少了一部分IO，另外投影操作时，只需要读取查询的字段。

3、支持对某一列进行向量计算

通常向量化执行引擎都是用在OLAP数仓类系统。而OLTP系统，由于使用行存，并且点查询居多，所以向量化执行的优势也很难体现出来。

两种向量化执行引擎的实现

方法一：仍使用火山模型，将一次一tuple的处理模式，修改为一次向上返回一组列存行值（例如：100-1000行）处理方式。
在这里插入图片描述

compare-row-column
图1中描述的就是火山模型实现的行存执行引擎与列存执行引擎，其中左边代表的是传统的行存火山模型，右边代表的是列存实现的火山模型。

火山模式是从执行计划树的根节点开始向叶子节点递归调用，然后由叶子节点扫描节点，过滤出符合条件的tuple 给上层节点处理&

最低0.47元/天解锁文章

国产数据库Hubble

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。