
CUDA
文章平均质量分 63
爱串门的小马驹
ai分布式,通信,大模型,人工智能框架,大规模集群学习分享,不定期更新
展开
-
C++ chrono来统计GPU CUDA函数耗时cudaSetDevice、cudaStreamCreate、cudaStreamSynchronize、cudaEventRecord
C++中的<chrono>库是一个用于处理日期和时间的标准库。它提供了时间点(time points)、时钟(clocks)、持续时间(durations)等相关的类和函数,使得在程序中处理时间变得更为方便和精确。今天我们就用chrono来统计GPU CUDA函数耗时,包括cudaSetDevice、cudaStreamCreate、cudaStreamSynchronize、cudaEventRecord。原创 2024-12-17 20:27:50 · 450 阅读 · 0 评论 -
CUDA 计时功能,记录GPU程序/函数耗时,cudaEventCreate,cudaEventRecord,cudaEventElapsedTime
为了测试GPU函数的耗时,可以使用 CUDA 提供的计时功能:cudaEventCreate, 和 cudaEventElapsedTime。这些函数可以帮助你测量某个 CUDA 操作(如设置设备)所花费的时间。原创 2024-12-09 19:33:13 · 701 阅读 · 0 评论 -
CUDA编程中kernel与device函数的区别,__device__、__host__和__global__
在CUDA编程中,__device____host__和__global__是三个特殊的关键字,它们用于定义函数的执行位置和可见性。在CUDA编程中,kernel函数和device__device____device____global____device____host__原创 2024-10-12 07:15:54 · 1870 阅读 · 0 评论