书看的有点慢,还没有上机运行。用了一个下午和一个晚上才把第三单元看完。对opencl的并行编程有了一个初步的印象。下面有贴点阵相乘的例子。
Chapter3:主机编程:数据传输和数据划分
S主机需要设备完成复杂的计算任务,至少需要提供三个东西:
-
所需执行的指令2、包含有待处理数据的缓存3、保存处理结果的缓存。
A:设置内核参数:clSetKernelArg
clSetKernelArg(cl_kernel kernel,cl_uint index, size_t size,const void *value)
其中,index为0表示,内核参数优先被访问。
为1表示,被第二个访问。
最后一个指针参数,指向的是传输给内核函数的数据。指针参数可指向基本的数据类型也可以指向内存对象的指针。或者采样器对象的指针或者NULL。
内存对象——主机和设备间数据传输的标准载体。
内存对象有两种类型:缓存对象和图像对象。
内存对象由cl_mem 结构表示。Eg:处理的数据为像素点,则对应的内存对象就是图像对象。
B缓存对象: 由clCreatBuffer创建。 缓存对象可以作为任何与图像处理无关的数据的载体。
clCreatBuffer(cl_context context,cl_mem_flags options,size_t size,void *host_ptr,cl_int *error)
返回的是cl_mem。options用来配置缓存对象的可访问性以及缓存数据在主机内存中的分配。一定是两个标志值的组合。
内存对象的性质(cl_mem_flags)中的可访问性(只读、只写、可读可写)都是限制的是设备(对缓存对象的访问)而非主机。如果试图修改这种访问性,则会产生未定义的结果。
B.1 分配缓存对象
主机可访问内内存的真正初衷应当是固定内存(pinned memory)——在操作系统创建和释放物理内存的时候,不参与页交换,如此可以提高系统的性能。
创建一个缓存内存的例子:
vec_buff=clCreateBuffer(context,CL