《CUDA C编程权威指南》—读书笔记—2.2计时

上一篇学习了CUDA的整体框架,简单介绍了关于线程组织和内存的知识。2.2节内容是CUDA编程中的一个实用工具。在进行并行编程时,我们主要关注的时算法、程序的执行效率,因此对核函数执行的时间统计是非常常见的。类似C/C++中的time.h 中的clock_t、clock()等,CUDA也提供了一些计时方法。

2.2.计时器
添加sys/time.h 头文件,实用gettimeofday来创建一个CPU计时器。注意这是在linux系统下的调用。

double cpuSecond(){
	struct timeval tp;
	gettimeofday(&tp,NULL);
	return ((double)tp.tv_sec+(double)tp.tv_usec*1.e-6);
}

检测核函数

double iStart =cpuSecond();
kernel<<<grid,block>>>(argument list);
cudaDeviceSynchronize();
double iElaps=cpuSecond()-iStart;

需要注意,由于核函数调用与主机端程序异步,需要用cudaDeviceSynchronize函数来等待GPU所有线程完成。
同样,在VS环境下,include time.h文件,利用clock()函数来获取系统时间。但是clock()对于较小的时间回输出0。因此需要用更精确的计时方法。
此处主要提前写一个CUDA中利用时间来计时的方法。cudaEventRecord()

cudaEvent_t start,stop;
cudaEventCreate(&Tstart);
cudaEventCreate(&Tstop);
float elapsedTime;
cudaEventRecord(start,0);
kernel<<<>>>;
cudaEventRecord(stop,0);
cudaEventSynchronize(stop);//等待CUDAAPI的同步
cudaEventElapsedTime(&elapsedTime,start,stop);
printf("time:%fms\n", elapsedTime);

这在之后的事件中还会介绍。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值