向量化执行

最新推荐文章于 2024-02-01 09:38:59 发布

stable_阿甘

最新推荐文章于 2024-02-01 09:38:59 发布

阅读量286

点赞数

分类专栏： hive 文章标签：单片机嵌入式硬件 hive

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/stable_zl/article/details/128691721

版权

hive 专栏收录该内容

13 篇文章 2 订阅

订阅专栏

一、背景

**CPU时钟速度：**时钟速度则测量 CPU 每秒执行的周期数，以 GHz（千兆赫）为单位。通常，时钟速度越高，CPU 运行速度越快。

摩尔定律（英语：Moore’s law）是由英特尔（Intel）创始人之一戈登·摩尔提出的。其内容为：集成电路上可容纳的晶体管数目，约每隔两年便会增加一倍；

从2005年开始，时钟速度停止增长，但是摩尔定律依然适用，芯片制造商继续在单位面积上放入更多的晶体管，创新的重点从更高的时钟速度转向多核和众核架构。

在这里插入图片描述

因为CPU的时钟速度趋于稳定，基于单个串行指令线程（感觉可以分成两个解释，一个是单线程，一个是串行指令）的传统应用程序不再能从新硬件中获得性能提升。

从那时起，大量应用程序利用不断增长的 CPU 内核数量，并行性已成为设计性能关键软件的常规部分。（任务并行性）

同时，芯片厂商也在提升指令并行性的性能，随着内核数量的增加，SIMD寄存器的宽度也在增加，利用指令级并行性称为**“vectorition”**。

在这里插入图片描述

把并行和Vectorization结合起来，可以最大力度地提升软件性能。感觉提升的性能是并行度*Vectorization

在这里插入图片描述

二、Vectorization of Code

2.1 举例

for(int i = 0; i < 4; i++) {
	c[i] = a[i] + b[i];
}

在串型指令中，CPU的寄存器没有被利用
在这里插入图片描述

在并行指令中，可以同时计算

如果SIMD With是512，那么最大可同时16个32位的int。

在这里插入图片描述

在这里插入图片描述

2.2 不能利用Vectorization的代码

2.2.1 循环依赖

在这里插入图片描述

2.2.2 非直接访问内存

在这里插入图片描述

2.2.3 程序不是线性执行（如方法调用，条件判断）

在这里插入图片描述

三、hive Vectorization

3.1 支持的数据类型和操作符

参考https://cwiki.apache.org/confluence/display/hive/vectorized+query+execution

结论：原子类型都可以支持，复杂类型不能支持

大部分常用的运算符、函数可以支持，自己写的udf不能支持

如果在where条件中写了自己的udf，把udf写在and的最右边，可以使得在左边使用vectorization，把过滤后的数据走udf

在这里插入图片描述

参考文献

https://www.quantifisolutions.com/vectorization-part-2-why-and-what

https://www.quantifisolutions.com/vectorization-part-1-the-rise-of-parallelism

https://www.hpc.kaust.edu.sa/sites/default/files/files/public/HPCSAUDI17/1_Vectorization_Intro.pdf

https://issues.apache.org/jira/browse/HIVE-4160

https://cwiki.apache.org/confluence/display/hive/vectorized+query+execution

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
向量化执行

本文介绍了CPU的向量化执行的优点，以及在Hive中的应用
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。