cudaEvent_t start, stop;
cudaEventCreate(&start); //创建开始事件
cudaEventCreate(&stop); //创建结束事件
cudaEventRecord( start, 0 ); //记录起始时间
// do some work on the GPU
cudaEventRecord( stop, 0 ); //记录结束时间
cudaEventSynchronize( stop ); //告诉运行时阻塞后边的语句,直到GPU执行到达stop事件。当cudaEventSynchronize返回时,就知道stop事件之前的所有GPU工作已经完成了。
float elapsedTime;
HANDLE_ERROR( cudaEventElapsedTime( &elapsedTime,
start, stop ) ); //计算两个事件之间经历的时间。第一个参数为某个浮点变量的地址,传回两个事件的时间差
printf( "Time to generate: %3.1f ms\n", elapsedTime );
HANDLE_ERROR( cudaEventDestroy( start ) ); //销毁进程
HANDLE_ERROR( cudaEventDestroy( stop ) ); //销毁进程
CUDA中的事件本质是一个GPU时间戳,获得一个时间戳,只需要:
- 首先创建一个事件
- 然后记录一个事件