阅读笔记-OpenCL：Parallel Computing on the GPU and CPU（Aaftab Munshi）

最新推荐文章于 2021-05-30 12:37:34 发布

caca001

最新推荐文章于 2021-05-30 12:37:34 发布

阅读量1.4k

点赞数

分类专栏： OpenCL 文章标签： parallel recursion pointers cuda 硬件驱动 thread

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/caca001/article/details/4522114

版权

OpenCL 专栏收录该内容

0 篇文章 0 订阅

订阅专栏

1、 GPU和CPU

CPU：多核，关注性能。

GPU：一般目的的数据并行计算协调器，改善数字精确度

CPU和GPU中的并行程序不一样：domian，ventor

图形API可以用于一般目的的计算

2、 OpenCL

（1）开放的计算语言，访问混合计算资源的接口语言，支持单或多处理器（CPU、GPU、CPU+GPU、多GPU）的并行执行，用于桌面和手持设备，与图形API（如OpenGL）一起工作。审查中的标准：开源，跨平台，厂商中枢。由Apple提出，与工业领导合作开发，性能增强技术（Mac OS X Snow Leopard）

（2）OpenCL的设计目标

A．使用系统中所有计算资源（GPU、CPU等；数据和任务并行计算模式）

B．高效的并行编程模式（基于C；抽取隐含的硬件的细节）

C．强调浮点计算精度（舍入；数值函数的最大允许错误）

D．未来硬件驱动的要求

（3）OpenCL软件层

A．Platform Layer：查询和选择系统的计算设备，初始化计算设备，并用来建立compute contexts和work-queues。

B．Runtime：管理资源，执行程式的kernel

C．编译器：ISO C99的子集合，并加上了OpenCL特殊的语法。编译和建立计算程序的执行（online，offline）。

（4）OpenCL执行模型

A．Compute Kernel：可执行代码的基本单元（类似一个C函数），数据/任务并行。

B．Compute Program：Compute Kernel和内嵌函数的集合，类似一个动态库

C．应用程式：把要执行的Compute Kernel排序；执行时依序或不依序；（最后1句看不懂）

Data-Parallel Execution Model

A 定义了N-Dimensional computation domain。

work-item：ND domain中每一个独立的项目（相当于CUDA的thread），每一个work-item会被并行地执行。

global work size：全部的work-item数量。

B work-group：把几个work-item作群组（相当于CUDA的thread block）。在work-group中的work-item可以通信，同步。在OpenCL中多个work-group并行执行的。

C global work size 映射到work-groups。

D 在所有OpenCL计算设备上执行。

Task-Parallel Execution Model

A 某些计算设备：CPU

B 类似执行单个work-item，用OpenCL书写的kernel，一个本机C/C++函数。

（5）OpenCL存储模型

A 松的，一致的，共享的。

B 多个不同的地址空间：可以冲突，有private memory、local memory、constant memory和global memory四种

（6） OpenGL语言

A源自ISO C99的标准，

B一些限制：recursion、function pointers，C99头文件函数等不能在kernel里使用。

C 支持C99中的预处理指令。

D 内嵌数据类型：数值、向量、结构、指针、图像，数据类型转换函数。

E 内嵌函数：

必须

可选

work-item functions

math.h

read and write image

relational

geometric functions

synchronization functions

double precision

atomics to global and local memory

selection of rounding mode

3、 OpenCL FFT例程，分host code和computer kernal。

4、 OpenCL和OpenGL

A 共享OpenGL的资源：纹理、缓存对象和描述缓存，数据shared而不是copy。

B 有效排列OpenCL和OpenGL指令。

C 应用程序可以选择执行OpenCL和OpenGL的计算设备。

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

caca001 CSDN认证博客专家 CSDN认证企业博客

码龄17年

21: 原创

118万+: 周排名

77万+: 总排名

5万+: 访问

: 等级

739: 积分

14: 粉丝

4: 获赞

8: 评论

2: 收藏

私信

关注

热门文章

分类专栏

测试
OpenCL
OpenGL 8篇
VC 2篇
其它 2篇
图形学 2篇
科研方法 5篇
职场 5篇
C# 1篇
云计算 1篇

最新评论

OBJ 文件格式
灿VS自己: 引用「求楼主详细解释负值索引问题，例如： v -2.077700 -0.129800 -3.699900 ...」 3个索引值相同，真有这种组合么？要是有的话，那就同问了，怎么算啊？
OpenGL 的渲染流水线
lby978232: 多谢，分享
云计算研究领域和学习途径
XCF6261690: 学习一下啊。。
OBJ 文件格式
lei_2050: 求楼主详细解释负值索引问题，例如： v -2.077700 -0.129800 -3.699900 v -2.638900 -0.275800 -2.635100 v -2.193400 0.558700 -3.334800 v -2.294400 -1.009200 -3.267500 v -2.337100 0.617200 -2.437600 v -2.246000 0.063600 -2.256200 vt 0.849700 -0.175500 vt 0.901400 -0.025400 vt 0.872200 -0.250600 vt 0.861900 -0.025400 vt 0.915800 -0.192900 vt 0.809300 -0.165100 vn -0.183730 0.976678 0.111099 vn -0.394459 0.544985 0.739860 vn -0.335787 0.204371 0.919500 vn -0.169028 0.930211 0.325787 vn 0.481779 -0.239149 -0.843029 vn 0.400223 0.890584 -0.216058 f -10/-10/-10 -11/-11/-11 -12/-12/-12 求解释上面f行顶点到底是怎么数？
OBJ 文件格式
caca001: 回复匿名用户：-448表示从"f"这行往上数第447个顶点,其它类似。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。