clCreateBuffer第二个参数可以有多种,详情请点击此次,对于前三个比较简单,在此就忽略。
1、CL_MEM_USE_HOST_PTR
对于CL_MEM_USE_HOST_PTR,刚开始buffer object的值是来自于host_ptr,但buffer object处理之后,host_ptr中的值如何变化,这点在OpenCL中没有定义。那就看看A卡对次是如何处理,一个小程序:
- data=new float[N];
- output=new float[N];
- for(int i=0;i<N;i++){
- data[i]=1;
- }
- b=1;
- ...
- bufferA=clCreateBuffer(context,CL_MEM_READ_ONLY|CL_MEM_USE_HOST_PTR,sizeof(float)*N,data,&err);
- ...
- err=clEnqueueReadBuffer(cmdQueue,bufferA,CL_TRUE,0,sizeof(float)*N,output,0,NULL,&timing_event);
- ...
- for(int i=0;i<N;i++){
- cout<<"output:"<<output[i];
- cout<<" data:"<<data[i]<<endl;
- }
对于kernel函数:
- __kernel void call_test(__global float* A,const float b)
- {
- int index=get_global_id(0);
- A[index]=b+100;
- }
程序执行结果如下:
- output:101 data:101
- output:101 data:101
- output:101 data:101
- output:101 data:101
- output:101 data:101
- output:101 data:101
- output:101 data:101
- output:101 data:101
- output:101 data:101
- output:101 data:101
- output:101 data:101
- output:101 data:101
- output:101 data:101
- output:101 data:101
- output:101 data:101
- output:101 data:101
- output:101 data:101
可以出,对于A卡OpenCL实现来说,对于buffer object操作完之后的值,也写回到host_ptr主机内存中。
2、CL_MEM_COPY_HOST_PTR
对于CL_MEM_COPY_HOST_PTR来说,buffer object的初始值使用host_ptr,buffer object操作完成后的值也不会写回到host_ptr主机内存中。继续看代码:
(修改上述代码创建buffer object代码)
- bufferA=clCreateBuffer(context,CL_MEM_READ_ONLY|CL_MEM_COPY_HOST_PTR,sizeof(float)*N,data,&err);
其他代码保持不变,程序结果为:
- output:101 data:1
- output:101 data:1
- output:101 data:1
- output:101 data:1
- output:101 data:1
- output:101 data:1
- output:101 data:1
- output:101 data:1
- output:101 data:1
- output:101 data:1
- output:101 data:1
- output:101 data:1
- output:101 data:1
- output:101 data:1
- output:101 data:1
- output:101 data:1
- output:101 data:1
- output:101 data:1
- output:101 data:1
3、CL_MEM_USE_PERSISTENT_MEM_AMD
对于CL_MEM_USE_PERSISTENT_MEM_AMD,创建的buffer object是在设备内存上的zero copy buffer。对于CL_MEM_USE_PERSISTENT_MEM_AMD的使用,请看下列代码:
- bufferA=clCreateBuffer(context,CL_MEM_READ_ONLY|CL_MEM_USE_PERSISTENT_MEM_AMD,sizeof(float)*N,0,&err);
- checkErr(err,"clCreateBuffer",__LINE__);
- void *mapPtr=clEnqueueMapBuffer(cmdQueue,bufferA,CL_TRUE,CL_MAP_WRITE,0,sizeof(float)*N,0,NULL,NULL,&err);
- memcpy(mapPtr,data,sizeof(float)*N);
- err=clEnqueueUnmapMemObject(cmdQueue,bufferA,mapPtr,0,NULL,NULL);
把buffer object映射到主机地址空间。