cudaError总结

1.code:1,reason:invalid argument
使用cudaHostRegister时,报了以上错误。
是因为我在使用streams时,由于数据量小于流的数量,所以有些流没分到数据,所以里面的cudaHostRegister里面的参数是空的。
2.cuda kernel中printf使用
size_t i=1;
printf(“i=%zu”,i);//屏幕上显式i=%zu
printf(“i=%d”,i);//屏幕上显式i=1

好像在kernel内使用printf识别不了%zu

3.使用overlap 传输时间和执行时间时,流不能太多,一般是3-4个,不然overlap不了

4.在block内使用shared memory要谨慎使用memset清零,因为有些写得慢的线程会把值给覆盖掉,又变成0了

5.When targeting devices with compute capability 7.x or higher, __shfl, __shfl_up, __shfl_down, and __shfl_xor are no longer available and their sync variants should be used instead.
也就是说这几个函数在cuda9.0的设备上不能用了
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值