cuda学习心得
文章平均质量分 71
GaryW666
这个作者很懒,什么都没留下…
展开
-
CUDA中thrust库的使用
CUDA中thrust库的使用 接触过CUDA的各位应该都了解过归约算法,包括归约算法求和、求最大最小值、求方差标准差等等。为了保证算法的时间复杂度,我们常常会花费大量的时间去优化归约算法的实现,包括线程分散度的问题、thread分歧以及bank冲突的问题等等。当数据维度较小时还能够冷静的分析每一个可能还存在优化空间的点,但当数据维度较大时,常常感觉优化的程度还是不够。不要慌,这时就是体现CUDA强大的时刻,CUDA的thrust库可以完美的解决这些问题。 本文主要记录一下最近使用到的thr原创 2021-01-05 21:02:20 · 9116 阅读 · 2 评论 -
Warp divergence & Bank conflict
Warp divergence & Bank conflictwarp、bank概念 warp是并行计算时最小的并发架构,通常由32个thread bank是对SM中共享内存的划分,划分个数与对应硬件warp中所含thread数一致。 对应使用的计算能力3.x版本的显卡,一个warp含有32个thread,因此划分的bank数也为3原创 2020-10-08 22:06:24 · 938 阅读 · 0 评论