简介
本篇主要是记录下,如果使用opencl自带方式,来计算它kerenl运行时间的方法。
具体实现
openl到代码框架,这里就不讲了,这方面网上资料很多,这里主要是获取运行时间的实现流程:
1、首先如果想用opencl自带方式打印时间戳。那么在clCreateCommandQueue函数中,必须设置CL_QUEUE_PROFILING_ENABLE。
比如:commandQueue = clCreateCommandQueue(context, devices[0], CL_QUEUE_PROFILING_ENABLE, &status);
2、获取kerenl运行时间,必须在确定对应操作完成之后。
也就是在:clFinish(commandQueue);
status = clWaitForEvents(1, &prof_event);之后。
3、使用函数clGetEventProfilingInfo,通过设置参数:
1、CL_PROFILING_COMMAND_QUEUED:获得kerenl放入命令队列时间。
2、CL_PROFILING_COMMAND_SUBMIT:获得kerenl进入关联设备时间。
3、CL_PROFILING_COMMAND_START :获得kerenl在关联设置中开始运行时的时间。
4、CL_PROFILING_COMMAND_END :获得kerenl在关联设备中结束运行时的时间。
4、使用CL_PROFILING_COMMAND_END得到的时间戳减去CL_PROFILING_COMMAND_QUEUED得到的时间戳,就是kerenl从放入命令队列到运行完成时的时间。
实例代码下载:http://download.csdn.net/detail/u011630458/9600167