OpenCL异构计算——并行编程入门

Cardinal Skywalker

于 2024-05-20 23:08:52 发布

阅读量299

点赞数 3

分类专栏： OpenCL异构计算文章标签：硬件架构系统架构 c语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_50998219/article/details/139077328

版权

OpenCL异构计算专栏收录该内容

2 篇文章 0 订阅

订阅专栏

OpenCL

OpenCL（开放计算语言）是非盈利性技术联盟Khronos Group管理的异构编程框架
OpenCL提供了各个设备的设备端语言和主机端控制层两方面的定义
- 设备端语言可以高效映射到众多的内存系统架构上
- 主机端语言的目标是以较低开销来高效管理复杂的并发程序
OpenCL这种编程模型是
- 跨平台的
- 得到工业界广泛支持的
- 适合开发人员学习和使用的

并行思维

经典加速计算方法
- 分治法
  - 问题迭代地划分为子问题
  - 直到子问题可以在当前计算资源上高效求解
- 散列-收集法
  - 输入数据的子集分配给每一个并行计算资源
  - 收集计算结果
如何从一个应用程序中提取并行性的问题留给程序员解决
硬件厂商将GPU和CPU结合在一块硅片上，开启新一代异构计算
应用中数据密集型和计算密集型部分称为kernel，由GPU执行
主机端CPU可以执行其他任务
两个例子
- 两个数组元素相乘
- wordcount

并发模型与并行编程模型

虽然OpenCL支持许多模型，但在实际使用时具体用哪个模型可能受到底层硬件的限制。

并发性考虑的是同时发生的两个或两个以上的活动
任务可以是并发的，但不一定需要并行执行
并行性指的是以提高总体性能为明确目标，并行进行两个或多个任务。
并行程序必须具有并发性，但是并发程序并不一定需要具有并行性。
并发任务之间的相互依赖性会使一些任务不能并行。

线程和共享内存

一个正在运行中的程序可以由多个子程序组成，它们分别维护着自己独立的控制流，可以并发执行。这些子程序被定义为线程（thread）。

线程间的通信通过读写同一个地址空间的内存来完成！
每个线程有它们的局部内存池（变量），所有线程都能看到同样的局部变量集
内存一致性模型被用来管理内存读取和写入顺序
共享内存模型的一个主要特征是程序员不需要考虑数据移动。这使任务之间的数据通信变得容易，并行代码的开发因而也往往可以比较简单。

大部分多核CPU平台支持一种或多种形式的共享内存，OpenCL支持在共享内存的设备上运行。

消息传递通信

消息传递通信模型使我们能详细指定计算时可能会使用内存的一系列任务之间如何进行通信。

若干任务可以在同一物理设备上
任务通过发送和接受具体消息实现数据交换
数据传输需要各个进程执行协同性操作——一个发送操作匹配一个接收操作

消息传递往往由一个独立于硬件的通用库程序来实现发送和接收消息

MPI是目前最流行的消息传递中间件，这些实现在本质上差别大，难以开发可移植应用程序

不同的并行颗粒

颗粒度为计算与通信之比
选择正确的并行颗粒度称为“分块”（chunking）
细颗粒度并行
- 计算强度低
- 没有足够的任务来隐藏长时间的异步通信
- 容易通过提供大量可管理的（更小的）工作单元实现负载均衡
- 如果颗粒太细，任务之间通信和同步开销太大，影响算法执行速度
粗颗粒度并行
- 计算强度高
- 完整的应用可以作为并行的粒度
- 难以有效实现负载均衡

选择多大的并行颗粒度取决于算法本身和其运行的硬件环境

数据共享和同步

并发程序中需要数据共享的情况包括如下：
- 某个任务的输出依赖于另一个任务产生的结果（生产者/消费者或管道执行模型）
- 需要汇集中间计算结果（归约计算）

Cardinal Skywalker

关注

3
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
OpenCL异构计算——并行编程入门

本文对应《OpenCL异构计算》一书第一章并行编程入门中的内容。旨在帮助读者梳理书中这一章节的主要内容，标出重点部分方便理解和记忆。
复制链接

扫一扫

专栏目录

Cardinal Skywalker

CSDN认证博客专家 CSDN认证企业博客

码龄4年

25: 原创

41万+: 周排名

6万+: 总排名

1万+: 访问

: 等级

505: 积分

233: 粉丝

255: 获赞

2: 评论

236: 收藏

私信

关注

热门文章

分类专栏

最新评论

分页式存储管理
CSDN-Ada助手: 恭喜您发布了关于“分页式存储管理”的博客！持续创作是非常值得鼓励的，您的专业知识和分享精神让读者受益匪浅。希望您可以继续深入研究这个领域，或许可以考虑探讨一下不同存储管理方法的优劣势，让读者更全面地了解相关知识。期待您的下一篇博客，谢谢您的分享！
OpenCL异构计算——OpenCL设备架构
CSDN-Ada助手: 恭喜作者发布了关于OpenCL设备架构的博客！持续创作是非常值得鼓励的，希望你能继续分享关于OpenCL异构计算的知识。下一步，可以考虑深入探讨OpenCL在不同硬件设备上的性能优化技巧，或者分享一些实际案例和应用经验，让读者更加深入了解OpenCL的应用领域。期待你更多精彩的内容！
信息论导论
CSDN-Ada助手: 非常感谢您分享这篇关于信息论导论的博客，内容简洁明了，让读者能够快速理解信息论的基础知识。希望您能继续坚持创作，分享更多深入的知识与见解。在学习信息论的过程中，除了了解通信理论、香农定理和编码等基础概念外，也可以进一步了解信息熵、信道容量、误差纠正编码等内容，这些都是信息论领域的重要知识。同时，可以尝试使用Python等编程语言实现信息论相关算法，加深对信息论概念的理解。希望这些扩展知识能够对您的学习有所帮助。期待您更多精彩的博客！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

Unity横板动作游戏 - 设置瓷砖地图(Tilemap)和叠层

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。