opencl程序架构

这几天研究了一下OpenCL,阅读了nvidia中的例子,归纳OpenCL程序的一般结构如下:

int main(int argc, char* argv[])
{

        //获得platform
        clGetPlatformIDs(1, &cpPlatform, NULL);

        //获得GPU设备
        clGetDeviceIDs(cpPlatform, CL_DEVICE_TYPE_GPU, 1, &cdDevice, NULL);

        //创建上下文环境
        hContext = clCreateContext(0, 1, &cdDevice, NULL, NULL, &ciErr);

        //创建命令队列
        cqCommandQueue = clCreateCommandQueue(hContext, cdDevice, 0, &ciErr);

        //在设备端开辟存储区
        cmDevSrc = clCreateBuffer(hContext, CL_MEM_READ_ONLY, sizeof(cl_float) * WorkSize, NULL, &ciErr);

        //创建program
        cpProgram = clCreateProgramWithSource(hContext, 1, &sProgramSource, NULL, NULL);

        //构建program
        clBuildProgram(cpProgram, 0, NULL, NULL, NULL, NULL);

        //创建运行在设备端的Kernel
        ckKernel = clCreateKernel(cpProgram, "VectorAdd", &ciErr);

        //为Kernel设置参数
        clSetKernelArg(ckKernel, 0, sizeof(cl_mem), (void*)&cmDevSrc);

        //将host主存数据copy到device端
        ciErr = clEnqueueWriteBuffer(cqCommandQueue, cmDevSrc, CL_FALSE, 0, sizeof(cl_float) * WorkSize, src, 0,

        // 调用Kernel,执行
        clEnqueueNDRangeKernel(cqCommandQueue, ckKernel, 1, NULL, (size_t*)&LocalSize, (size_t*)&WorkSize, 0, NULL, NULL);

       //从device端读取计算结果到host端
       clEnqueueReadBuffer(cqCommandQueue, cmDevDst, CL_TRUE, 0, sizeof(cl_float) * WorkSize, dst, 0, NULL, NULL);

        return 0;
}

 

在运行过程中,可能会因为某些参数的设置出了问题,导致GPU端不能正确运行。这时候最好调试一下,究竟在哪里出了问题,没有得到想要的结果,这样才能够准确定位。我就在的搭配cpProgram的时候,没有进行clBuildProgram,导致后面出现问题:(。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值