- 博客(1)
- 收藏
- 关注
原创 GPU并行——循环展开
利用GPU进行多线程并行计算,将for循环程序块中单次循环的计算工作分配到GPU的单个线程中去,由此多层嵌套循环可被展开。下面举例介绍如何快速将线程标号对应到相应循环标号上: 假设现有如下嵌套循环: 要对整个循环进行展开需要用到nelx * nely* nelz个线程,为了适应硬件对线程束大小的安排,线程块设为32*32大小,具体线程分配如下:#define BLOCK_WIDTH 1024//分配线程 int bkX1 = nelx * nely* nelz...
2021-07-04 17:16:35 2609
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人