【GPU】CUDA、OpenCL、OpenMP、OpenACC等并行运算框架区别

bandaoyu

已于 2025-04-17 07:32:26 修改

阅读量1k

点赞数 21

文章标签： cuda NCCL 异构

于 2025-04-15 06:20:42 首次发布

本文链接：https://blog.csdn.net/bandaoyu/article/details/147237116

版权

CUDA版本更新很快，但仅限N卡。OpenCL跨平台，社区貌似不太活跃，更新不如CUDA。

OpenMP 主要是针对CPU，最近开始支持GPU了，OpenACC：适合需要快速将CPU代码移植到GPU上的并行计算任务。

OpenCL: 是一个开放的标准，用于跨平台的并行编程，支持CPU，GPU， DSPs， FPGAs 等（ NV GPU/Xeon Phi/Intel等品牌都支持）

在多进程方面使用 task-based 和 data-based parallelism。

- 关键词： API
- 语言支持： C/C++, Fortran
- 优点：移植改动少，支持普遍（普通的gcc都支持）
- 缺点：只支持shared memory

OpenACC: 支持CPU/GPU工作，从名字Accelerator就可以推断出，主要用于CPU代码向GPU的移植（？有待考证，我在课程中主要是这么用的。。。），更新方面其实也不快，需要注意编程技巧，否则代码会变慢。

- 关键词： API
- 语言支持： C/C++, Fortran
- 优点：移植简单
- 缺点：编译器啊，支持PGI，看计划有支持GCC，但还不知道什么时候才能发布

是一个类似于OpenMP的编程接口，专门为加速器（如GPU）设计。它通过使用编译制导语句来简化并行计算的编程工作，让开发者能够更容易地将计算任务迁移到加速器上执行。OpenACC的目标是降低使用加速器进行高性能计算的技术门槛，使非专家也能有效地利用这些资源。