cuda error问题的解答

最新推荐文章于 2024-09-12 09:02:34 发布

xxdded

最新推荐文章于 2024-09-12 09:02:34 发布

阅读量2.2k

点赞数

分类专栏： cuda 文章标签： cuda visual studio 2010 cpu gpu 函数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xxdded/article/details/50879480

版权

cuda 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

cuda中有cudaError_t这个类别，可以记录cuda错误。所有的cuda库函数，几乎都返回一个cudaError_t。

《GPU高性能编程》中使用HANDLE_ERROR宏函数，处理每个函数返回的cudaerror

static void HandleError( cudaError_t err,const char *file,int line ) {
          if (err != cudaSuccess) {
              printf( "%s in %s at line %d\n", cudaGetErrorString( err ), file, line );
              exit( EXIT_FAILURE );
          }
  }
  #define HANDLE_ERROR( err ) (HandleError( err, __FILE__, __LINE__ ))
  #define HANDLE_NULL( a ) { \
     if (a == NULL) { printf( "Host memory failed in %s at line %d\n", \
                 __FILE__, __LINE__ ); \
          exit( EXIT_FAILURE );}}

但是对于kernel函数，没有返回cudaerror，这个时候检查错误，需要用到，

cudaError_t err = cudaGetLastError();
printf("%s\n",cudaGetErrorString(err));

打印出最近出的错。

1. too many resources requested for launch

出现这种情况，有可能是kernel中smem或者register使用超过了限制。在编译的时候可以用 --ptxas-options=-v,这样在编译过程中，会打印出你程序中每个核函数register和memory的使用情况。一般有以下两种解决办法：

（1）设定max register的限定：编译时加入 -maxrregcount = 24，限定每个线程只能使用24（根据个人情况定）个register，多出的直接使用local memory代替

（2）减少每个block的线程数。register是针对block有个总量，如果block数减少了，每个线程使用的reg数就增多了。

-----------常用nvcc编译options-------------

-arch=sm_13 enables double precision on compatible hardware

-G enables debugging on device code

--ptxas-options=-v shows register and memory usage

--maxregcount=N limits the number of registers to N

-use_fast_math uses fast math library

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。