CUDA基础
Wendell_0
这个作者很懒,什么都没留下…
展开
-
CUDA优化LBP(loopy belief propegation)
CUDA优化LBP大致思路msg样式CUDA编程注意事项性能分析大致思路 通过阅读开源的代码,我发现现在cuda优化lbp的算法基本都是将每一个节点组装成一个类实例,当需要进行计算msg,或者传播的时候,通过kernel函数调用成员函数(__device__)对该节点的数据进行所要求的操作。至于每个节点的数据成员,如果该lbp算法的label和msg比较简单,直接使用基本数据类型即可。反之,则要慎重考虑。这里提供一个思路:可以将所有节点的同一种数据,提前计算size,在kernel函数外统一分原创 2020-08-25 20:59:22 · 629 阅读 · 0 评论 -
CUDA编程注意事项(一)
CUDA编程注意事项(一)注意下载的CUDA版本与驱动版本相符关于CUDA报错应进行充分的单元测试GPU上进行的操作应尽可能简单 这段时间负责使用CUDA优化LBP算法,因为刚开始学习使用CUDA,所以走了很多弯路,挖了很多坑,现在对在这段时间学习到的经验进行总结,以备后续开发时参考。至于CUDA优化LBP部分,因为还没有确定不采用,所以还不敢发到网上,或许过段时间会写个blog介绍一下思路。注意下载的CUDA版本与驱动版本相符 如果版本不符,你运行cuda程序的时候,会报找不到G原创 2020-08-10 21:26:35 · 621 阅读 · 0 评论