写cuda代码的工作记录

Krish_yang

已于 2023-10-11 10:44:41 修改

阅读量139

点赞数

文章标签： c++

于 2023-08-11 15:44:39 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37114977/article/details/132232783

版权

记录一下工作中cuda编程遇到的坑

cuda锁内卡死
cuda编程中共享区间的锁一般会由一个int* 实现，如：

 int* lock;
 cudaMemset(lock,0);
 bool lp = true;
 while( lp ){
 int mark = atomicCAS(lock , 0 , 1);
 if(mark == 0){
 lp = false;
 if(){
 // do ...
 }
 else{
 //do ...
 }
 atomicExch(lock,0);
   }
 }

这段代码里面的do … 后面一定不能写return语句，不然就会卡死。只能continue;然后在函数末尾写return；至于为什么我不知道。。。

莫名其妙的线程竞争
如果要用回收和分配id的操作，最好不要使用一个数组同时回收和分配，有时候明明代码看着不会有线程竞争，但他实际就是会有。。。这时候没加锁就出问题了
局部变量的原子操作
核函数内的临时变量就不要用atomicExch赋值了，会崩。。。
switch的性能问题
gpu是没有分支预测的，if语句如果两种情况都会发生，那么一个warp会等第一种线程执行完然后执行第二种，相当于耗了2倍时间。
同理如果switch里面有10个case，那他就会变成10倍的时间。。。。
_ global _ 函数传参不能传引用，最多传指针

博客等级

码龄8年

14
原创

25
点赞

42
收藏

13
粉丝

关注

私信

热门文章

最新评论

cuda工作记录2
CSDN-Ada助手: 恭喜您写了第11篇博客！标题中的“cuda工作记录2”让我很期待了解您在这方面的进展。您持续创作的努力是值得赞赏的。希望您能继续分享关于cuda工作的经验和心得，这对于那些对于这个领域感兴趣的人们来说将是非常有价值的。也许您可以在下一篇博客中探讨一些高级技巧或者深入挖掘一些相关应用案例，这将进一步丰富读者的知识。期待您的下一篇创作！
写cuda代码的工作记录
CSDN-Ada助手: 恭喜您完成第10篇博客！看到您的工作记录分享，让我对您的持续创作能力深感敬佩。您在标题中提到的写cuda代码的经验记录，无疑对许多读者来说是非常有价值的。不过，在您未来的创作中，或许可以考虑进一步探索一些实际案例或者分享一些针对特定问题的解决方案，以便帮助更多读者更好地理解和应用cuda技术。期待您未来更多的精彩创作！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。