cudaerror解决办法

cuda中有cudaError_t这个类别,可以记录cuda错误。所有的cuda库函数,几乎都返回一个cudaError_t。

《GPU高性能编程》中使用HANDLE_ERROR宏函数,处理每个函数返回的cudaerror

 static void HandleError( cudaError_t err,constchar *file,int line ) {
         if (err != cudaSuccess) {
             printf( "%s in %s at line %d\n", cudaGetErrorString( err ), file,line );
             exit( EXIT_FAILURE );
         }
  }
  #define HANDLE_ERROR( err ) (HandleError( err,__FILE__, __LINE__ ))
  #define HANDLE_NULL( a ) { \
    if (a == NULL) { printf( "Host memory failed in %s at line %d\n",\
                __FILE__, __LINE__ ); \
         exit( EXIT_FAILURE );}}

 

但是对于kernel函数,没有返回cudaerror,这个时候检查错误,需要用到,

cudaError_t err = cudaGetLastError();
printf("%s\n",cudaGetErrorString(err));

打印出最近出的错。

 

1.too many resources requested for launch

出现这种情况,有可能是kernel中smem或者register使用超过了限制。在编译的时候可以用 --ptxas-options=-v,这样在编译过程中,会打印出你程序中每个核函数register和memory的使用情况。一般有以下两种解决办法:
(1)设定maxregister的限定:编译时加入 -maxrregcount =24,限定每个线程只能使用24(根据个人情况定)个register,多出的直接使用localmemory代替
(2)减少每个block的线程数。register是针对block有个总量,如果block数减少了,每个线程使用的reg数就增多了。

-----------常用nvcc编译options-------------
-arch=sm_13 enables double precision oncompatible hardware
-G enables debugging on device code
--ptxas-options=-v shows register and memory usage
--maxregcount=N limits the number of registers to N
-use_fast_math uses fast math library
  • 3
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值