这里得到的elapsedTime就是执行GPU端代码所需时间,单位ms。
总流程为:int main()
{ cudaEvent_t start,stop;
float time;
cudaEventCreate(&start);
cudaEventCreate(&stop);
cudaEventRecord(start,0);
// 中间为程序部分 //
cudaEventRecord(stop,0);
cudaEventSynchronize(stop);
cudaEventElapsedTime(&time,start,stop);
printf("Time used:%.2f ms\n",time);
cudaEventDestroy(start);
cudaEventDestroy(stop);
}