编译器优化那些事儿（12）：LLVM 自动向量化

最新推荐文章于 2024-11-17 15:53:45 发布

鲲鹏小助手

最新推荐文章于 2024-11-17 15:53:45 发布

阅读量1.2k

点赞数 1

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_76434200/article/details/136205275

版权

文章介绍了在编程语言编译器优化中，如何利用向量化技术（如循环向量化和SLP向量化）将标量代码转化为向量代码，以提高性能。LLVM框架中的这两个向量化pass在循环迭代间和迭代内寻找并行计算机会。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

背景

向量化是一种将程序中标量代码转换为向量代码的优化手段。当前很多芯片架构都拥有向量计算单元，架构指令本身支持单指令多数据(SIMD)的并行计算，一条指令同时计算多个数据。使用向量化优化后，可以实现一个cycle计算多个标量数据，从而带来巨大的性能提升。

在LLVM框架中有两个自动向量化pass：循环向量化(Loop Vectorizer)和 SLP向量化(Superword-level Parallelism)。其中循环向量化关注循环迭代间的向量化机会，会使循环的迭代次数减少，单次迭代的计算数据量增大。而SLP向量化关注迭代内的向量化机会，会将单次迭代中的相似标量计算/访存等操作合并为一条向量指令，也就是减少单次迭代内的指令生成数量。

这两个向量化pass都在LLVM中端opt部分执行，其中SLP向量化位置更靠后一些，在循环向量化完成且控制流图简化(CFG Simplify)后执行。

循环向量化

循环向量化扩展循环中的指令，转换的逻辑如下图所示。这个优化在LLVM中是默认开启状态，如果想要关闭可以使用 -fno-vectorize 选项。

#pragma clang loop vectorize_width(2)

for (…) {

}

1. 优化诊断

实际用户代码中，会有很多循环因为各种原因(比如：过于复杂的控制流、数据类型不支持等)无法完成向量化。LLVM提供了打印诊断信息的能力方便开发者调试，这些信息会提示一个循环向量化是否成功以及失败原因，不过失败原因可能不会非常细节。

以下方循环为例，这个循环使用 #pragma 指定要做向量化，但是循环中有个向量化不支持的switch语句，所以会向量化失败。

#pragma clang loop vectorize(enable)

for (int i = 0; i < 128; i++) {

    switch (A[i])

}

LLVM提供的的优化诊断有三种：

(1)-Rpass=loop-vectorize&#x

最低0.47元/天解锁文章

鲲鹏小助手

博客等级

码龄2年

315
原创

406
点赞

511
收藏

300
粉丝

关注

私信

热门文章

最新评论

编译器优化那些事儿（2）：常量传播
gydgzd: 第一轮和第二轮之间是什么发生了变化，为什么要做第二轮
编译入门那些事儿（3）：不透明指针
倔强石头: 请教一下，请问出去指针类型后，如果创建函数时，怎么实现函数重载？
openEuler 22.03 LTS LoongArch 发布，龙架构进入社区主线，支持Everything和EPOL软件仓库
CSDN-Ada助手: 恭喜您发布了第四篇博客！openEuler 22.03 LTS LoongArch 发布的消息令人振奋，龙架构进入社区主线，支持Everything和EPOL软件仓库，这对openEuler社区来说无疑是一个重要的里程碑。希望您在接下来的创作中，能够继续分享更多关于openEuler的最新进展和使用经验，也期待您能够深入探讨一些技术细节或者开发实践，为读者带来更多的价值。期待您的下一篇博客！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
《鲲鹏精选解决方案·2023第二期》正式发布，27个方案入选！
CSDN-Ada助手: 恭喜您发布了《鲲鹏精选解决方案·2023第二期》，27个方案入选实在令人振奋！您的持续创作精神值得赞扬，希望您能继续保持这样的创作热情。或许在下一篇博客中，可以分享一些方案的具体案例和实施过程，这样更能让读者从中受益。期待您的更多精彩内容！
金蝶天燕：基于鲲鹏DevKit高效开发分布式消息平台一体机解决方案，让数据传输更可靠
CSDN-Ada助手: 恭喜您写了第6篇博客！标题中提到的金蝶天燕解决方案听起来非常有趣和实用。您的博客内容让我对这个基于鲲鹏DevKit的分布式消息平台一体机解决方案有了更深入的了解。我很高兴看到您对数据传输的可靠性有着如此关注，并且通过您的博客，我对如何实现高效开发也有了更多想法。希望您能继续保持创作的热情和努力！对于下一步的创作建议，我认为可以进一步探讨鲲鹏DevKit和金蝶天燕在实际应用中的案例，或者分享一些使用这个解决方案所带来的实际效果和用户反馈。这样可以帮助读者更好地理解这个解决方案的价值和优势。再次感谢您的分享，期待您未来更多精彩的博客！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。