CUDA-事件计时

最新推荐文章于 2024-08-25 12:45:14 发布

dllpjy

最新推荐文章于 2024-08-25 12:45:14 发布

阅读量1k

点赞数

分类专栏： cuda 文章标签： cuda

本文链接：https://blog.csdn.net/Bzhnja/article/details/40826551

版权

cuda 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

cudaEvent_t start, stop;
cudaEventCreate(&start);
cudaEventCreate(&stop);
cudaEventRecord(start, 0);
for (int i = 0; i < 2; ++i) {
	cudaMemcpyAsync(inputDev + i * size, inputHost + i * size, size, cudaMemcpyHostToDevice, stream[i]);
	MyKernel<<<100, 512, 0, stream[i]>>>(outputDev + i * size, inputDev + i * size, size);
	cudaMemcpyAsync(outputHost + i * size, outputDev + i * size, size, cudaMemcpyDeviceToHost, stream[i]);
}
cudaEventRecord(stop, 0);
cudaEventSynchronize(stop);
float elapsedTime;
cudaEventElapsedTime(&elapsedTime, start, stop);

cudaEventRecord的函数原型是 cudaError_t cudaEventRecord (cudaEvent_t event, cudaStream_t stream)

记录一个事件。如果stream 是非零的，当流中所有的操作完毕，事件被记录；否则，当CUDA context 中所有的操作完毕，事件被记录。

注意对事件的同步操作是在记录事件之后，顺序不能颠倒。

在本例中，cudaEventSynchronize(stop);这句可以用 cudaStreamSynchronize(0); 或者 cudaThreadSynchronize();来代替，能达到同样的效果。

代码来自官方文档。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

dllpjy

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
CUDA-事件计时

cudaEvent_t start, stop;cudaEventCreate(&start);cudaEventCreate(&stop);cudaEventDestroy(start);cudaEventDestroy(stop);cudaEventRecord(start, 0);for (int i = 0; i < 2; ++i) { cudaMemcpyAsync(in
复制链接

扫一扫