GPU通用可编程技术中的scatter与gather

最新推荐文章于 2024-07-08 19:49:39 发布

rickArkin

最新推荐文章于 2024-07-08 19:49:39 发布

阅读量4.2k

点赞数

文章标签：编程 shader 存储 gpgpu cuda stream

本文链接：https://blog.csdn.net/rickArkin/article/details/1931833

版权

本文探讨了GPU通用可编程技术中的scatter/gather操作，它们分别用于非连续存储器地址的数据写入和读取。在CUDA架构中，scatter/gather允许在并行计算中实现更灵活的内存访问。尽管fragment shader可以实现gather，但不支持scatter，而vertex shader可以通过纹理采样实现gather，geometry shader则为scatter提供了可能性。当前GPU的scatter/gather操作仍有限制，但在GPGPU发展中具有重要意义。

摘要由CSDN通过智能技术生成

随着GPU可编程性能的增强以及GPGPU技术的不断发展，人们希望基于流处理器模型的GPU能够像CPU一样，在支持流程分支的同时，也允许对存储器进行灵活的读写操作。在进行早期的GPU通用可编程技术研究时，Ian Buck [1]就曾经指出，缺乏灵活的存储器操作，是制约GPU完成复杂计算任务的关键，因此他在设计Brook [2]时增加了对scatter/gather特性的支持，但是其实现过程仍然是通过一些以牺牲性能为代价的技巧完成的。
在GPU中scatter/gather的实现与第一向量机中的很相似，scatter允许将数据输出到非连续的存储器地址内，而gather则允许从非连续的存储器地址内读取数据。因此如果认为存储器（如DRAM）是一个二维数组，scatter可以看作利用下标将数据写入数组中的任意位置，即a[i] = x，而gather可以看作是利用下标从数组中的任意位置读出数据，即x = a[i]。
在CUDA [5]的架构中（图1），每个ALU可以看作是一个处理核心&