获取cuda的运行状态

最新推荐文章于 2024-08-23 15:56:40 发布

HockerF

最新推荐文章于 2024-08-23 15:56:40 发布

阅读量2.8k

点赞数 1

分类专栏： cuda编程

本文链接：https://blog.csdn.net/u012939880/article/details/93197049

版权

cuda编程专栏收录该内容

4 篇文章 0 订阅

订阅专栏

我们可以获取cuda的运行状态来判断cuda程序的运行情况，这是我们唯一判断cuda程序是否发生运行错误的方式。

因为：

1. cuda程序不能做中间运行调试变量的打印输出，
2. cuda也不能做与程序返回值不兼容的状态回传
	注意：如果与程序返回值的状态量是兼容的，我们可以将状态量放到放回值中，这也是一种调试手段。

无所不用其极，这次调试，我能用的方法都用了，哈哈

先说获取cuda运行方法的理想方法，先定义如下宏。 <这个宏是我cuda例程中截取的，如果每一个cuda调用语句都加一个if判断，cuda程序会变得老长，影响程序的美观和后期调试>

// This will output the proper CUDA error strings in the event that a CUDA host call returns an error
#ifndef checkCudaErrors
#define checkCudaErrors(err)  __checkCudaErrors (err, __FILE__, __LINE__)

// These are the inline versions for all of the SDK helper functions
inline void __checkCudaErrors(cudaError_t err, const char *file, const int line)
{
    if (cudaSuccess != err)
    {
        fprintf(stderr, "checkCudaErrors() Driver API error = %04d \"%s\" from file <%s>, line %i.\n",
                err, cudaGetErrorString(err), file, line);//getCudaDrvErrorString
        exit(EXIT_FAILURE);
    }
}
#endif

程序运行直接使用上面的定义即可。
比如我们要创建一块显存空间，我们可以用如下方式加上宏定义进行安全判定：

	void *data;
    checkCudaErrors(cudaMalloc( (void**)&data,  data_size));

刚才我也提到了，可以用些小技巧获取程序的运行状态，比如说使用程序结构现有的输出来做状态的传递，但是切记不要对cuda中的状态变量的指针产生想法，指针和主机的指针是两个村的门牌号，传出来也是没有意义的。

使用返回值来查看cuda程序的状态，好处就是可以详细的看到每一个线程的运行状况，不会如上面checkCudaErrors这么笼统的返回一个状态量，根据每个线程的状态可以更好的跟踪程序运行。

有啥不懂的可以留言交流，一起探讨。

HockerF

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录