CUDA优化LBP(loopy belief propegation)
CUDA优化LBP大致思路msg样式CUDA编程注意事项性能分析大致思路 通过阅读开源的代码,我发现现在cuda优化lbp的算法基本都是将每一个节点组装成一个类实例,当需要进行计算msg,或者传播的时候,通过kernel函数调用成员函数(__device__)对该节点的数据进行所要求的操作。至于每个节点的数据成员,如果该lbp算法的label和msg比较简单,直接使用基本数据类型即可。反之,则要慎重考虑。这里提供一个思路:可以将所有节点的同一种数据,提前计算size,在kernel函数外统一分
原创
2020-08-25 20:59:22 ·
598 阅读 ·
0 评论