对CUDA内核函数运行时间测量的方法

最新推荐文章于 2025-03-08 00:07:54 发布

IT沐沐

最新推荐文章于 2025-03-08 00:07:54 发布

阅读量4.6k

点赞数 2

分类专栏： cuda

本文链接：https://blog.csdn.net/a923751813/article/details/51065308

版权

cuda 专栏收录该内容

4 篇文章

订阅专栏

方法一：

[cpp]view plain copy 
   
 cudaEvent_t start1;  
 cudaEventCreate(&start1);  
 cudaEvent_t stop1;  
 cudaEventCreate(&stop1);  
 cudaEventRecord(start1, NULL);  
 // 需要测时间的内核函数kernel;  
 cudaEventRecord(stop1, NULL);  
 cudaEventSynchronize(stop1);  
 float msecTotal1 = 0.0f;  
 cudaEventElapsedTime(&msecTotal1, start1, stop1);  

方法二：

[cpp]view plain copy 
   
 StopWatchInterface * timer_cublas;  
 sdkCreateTimer(&timer_cublas);  
 sdkStartTimer(&timer_cublas);  
 // 需要测时间的内核函数kernel;  
 cudaSyncThreads()  
 sdkStopTimer(&timer_cublas);  
 double dSeconds = sdkGetTimerValue(&timer_cublas)/((double)nIter);