CUDA学习——Chapter 2（3）核函数的性能

最新推荐文章于 2021-01-14 15:43:22 发布

KarK_Li

最新推荐文章于 2021-01-14 15:43:22 发布

阅读量829

点赞数 2

分类专栏： CUDA 文章标签： CUDA C 并行计算

本文链接：https://blog.csdn.net/weixin_40427089/article/details/86624475

版权

第二章

并行计算，本质上来说，就是为了提升工作效率。使得一些工作可以更快地完成。那么如何衡量完成工作的快慢，自然是核函数花费时间的多少。这一篇文章将会给大家介绍，如何对核函数计时，以及通过改变global memory的分割方式，进一步提升核函数的效率。

本文介绍两种计时的方法：CPU时钟计时和nvprof计时

CPU时钟计时

在Linux中，sys/time.h头文件提供了一系列关于时钟的方法。在Linux环境下使用CPU时钟计时的代码如下：

#include <sys/time.h>
double cpuSecond(){
    struct timeval tp;
    gettimeofday(&tp,NULL);
    return ((double)tp.tv_sec+(double)tp.tv_usec*1.e-6);
}
double iStart=cpuSecond();
kernel_name<<<grid,block>>>(argument list);
cudaDeviceSychronize();
double iElaps=cpuSecond()-iStart;

而Windows下则直接使用clock()方法，返回的是CPU时钟时间。
Example 2-5

#pragma warning(disable:4819)
#include <cuda_runtime.h>
#include <device_launch_parameters.h>
#include <stdio.h>
#include <time.h>
#include <stdlib.h>
#include <string.h>

最低0.47元/天解锁文章

KarK_Li

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
CUDA学习——Chapter 2（3）核函数的性能

第二章并行计算，本质上来说，就是为了提升工作效率。使得一些工作可以更快地完成。那么如何衡量完成工作的快慢，自然是核函数花费时间的多少。这一篇文章将会给大家介绍，如何对核函数计时，以及通过改变global memory的分割方式，进一步提升核函数的效率。本文介绍两种计时的方法：CPU时钟计时和nvprof计时CPU时钟计时在Linux中，sys/time.h头文件提供了一系列关于时钟的方法。...
复制链接

扫一扫