如何记录kernel启动时间

最新推荐文章于 2023-07-06 20:59:51 发布

xie7132524

最新推荐文章于 2023-07-06 20:59:51 发布

阅读量1.5k

点赞数

分类专栏： CUDA 文章标签： cuda

本文链接：https://blog.csdn.net/u010794523/article/details/37599627

版权

CUDA 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

    <pre class="cpp" name="code">    sdkStartTimer(&timer);
    cudaEventRecord(start, 0);
    cudaMemcpyAsync(d_a, a, nbytes, cudaMemcpyHostToDevice, 0);
    increment_kernel<<<blocks, threads, 0, 0>>>(d_a, value);
    cudaMemcpyAsync(a, d_a, nbytes, cudaMemcpyDeviceToHost, 0);
    cudaEventRecord(stop, 0);
    sdkStopTimer(&timer);

上面这个例子，可以利用sdkGetTimerValue(&timer)来计算kernel call的时间。因为cudaMemcpyAsync是异步的拷贝。checkCudaErrors(cudaEventElapsedTime(&gpu_time, start, stop));可以用来计算GPU计算的时间。

这里a是pinnedmemory。

如果把上面代码改为：

    sdkStartTimer(&timer);
    cudaEventRecord(start, 0);
    cudaMemcpy(d_a, a, nbytes, cudaMemcpyHostToDevice, 0);
    increment_kernel<<<blocks, threads, 0, 0>>>(d_a, value);
    cudaMemcpy(a, d_a, nbytes, cudaMemcpyDeviceToHost, 0);
    cudaEventRecord(stop, 0);
    sdkStopTimer(&timer);

这时，timer计算的时间不再是kernel启动的时间了。一会去测试下。

xie7132524

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
如何记录kernel启动时间

sdkStartTimer(&timer); cudaEventRecord(start, 0); cudaMemcpyAsync(d_a, a, nbytes, cudaMemcpyHostToDevice, 0); increment_kernel>>(d_a, value); cudaMemcpyAsync(a, d_a, nbytes, cudaMemcpy
复制链接

扫一扫

专栏目录