1.clock_t clock();
在内核启动和结束时对此计数器取样,确定两次取样的差别,然后为每个线程记录下结果,这为各线程提供度量方法
2.cudaEvent_t
cudaEvent_t start, stop;
cudaEventCreate(&start);
cudaEventCreate(&stop);
这些事件可用于为代码示例计时,方法如下
cudaEventRecord(start,0);
。。。。。。。。。
。。。。。。。。。。。。
cudaEventRecord(stop, 0);
cudaEventSynchronize(stop);
float elapsedTime;
cudaEventElapsedTime(&elapsedTime, start,stop);
cudaEventDestroy(start);
cudaEventDestroy(stop);