kernel计时,记录,以后需要就直接过来抄了。
cudaEvent_t start,stop;
HANDLE_ERROR(cudaEventCreate(&start));
HANDLE_ERROR(cudaEventCreate(&stop));
HANDLE_ERROR(cudaEventRecord(start,NULL));
//kernel计算
kernel<<<>>>();
HANDLE_ERROR(cudaEventRecord(stop,NULL));
cudaEventSynchronize(stop);
float msecTotal = 0.0f;
cudaEventElapsedTime(&msecTotal, start, stop);
printf("Time spend on GPU is %f ms\n", msecTotal);
具体的意思再解释吧。。