CUDA性能测量与错误处理
- 讨论如何通过CUDA事件来测量它的性能
- 如何通过CUDA代码进行调试
1.测量CUDA程序的性能
1.1 CUDA事件
- CPU端的计时器可能无法给出正确的内核执行时间
- CUDA事件等于是在你的CUDA应用运行的特定时刻被记录的时间戳,通过使用CUDA事件API,由GPU来记录这个时间戳
- 使用CUDA测量时间需要两个步骤:创建事件和记录事件,记录事件(开始时间与结束时间)
- 代码如下:
#include "stdio.h"
#include<iostream>
#include