3维线程格 gpu_SIMD数据并行（三）——图形处理单元（GPU）

最新推荐文章于 2024-04-13 09:45:56 发布

百越闲人

最新推荐文章于 2024-04-13 09:45:56 发布

阅读量758

点赞数

文章标签： 3维线程格 gpu

本文链接：https://blog.csdn.net/weixin_27603469/article/details/111890508

版权

本文详细介绍了GPU的架构和工作原理，特别是其在处理并行任务中的优势。GPU通过线程并行、指令并行和SIMD数据并行等方式实现高效计算，其流式多处理器结构包含多个SIMD线程，通过warp调度器进行线程调度，以隐藏DRAM访问延迟。CUDA和PTX指令集为GPU编程提供了便利，使开发者能够利用GPU的并行计算能力。

摘要由CSDN通过智能技术生成

在计算机体系中，数据并行有两种实现路径：MIMD(Multiple Instruction Multiple Data，多指令流多数据流)和SIMD(Single Instruction Multiple Data，单指令流多数据流)。其中MIMD的表现形式主要有多发射、多线程、多核心，在当代设计的以处理能力为目标驱动的处理器中，均能看到它们的身影。同时，随着多媒体、大数据、人工智能等应用的兴起，为处理器赋予SIMD处理能力变得愈发重要，因为这些应用存在大量细粒度、同质、独立的数据操作，而SIMD天生就适合处理这些操作。

SIMD结构有三种变体：向量体系结构、多媒体SIMD指令集扩展和图形处理单元。本文集中围绕图形处理单元( Graphics Processing Unit, GPU)进行描述。

图形处理单元(GPU)

0. 写在前面

GPU 独立于 CPU 而发展，拥有自己的一套体系结构，并在发展中形成了自己的专门术语。加上不同设计厂商之间使用的术语往往不太一样，容易给 GPU 初学者带来名词分辨上的困扰。

鉴于 NVIDIA GPU 的成功，本文只使用 NVIDIA 官方术语进行表述。我自己在看《计算机体系结构：量化方法研究》这本书时，也存在着不少困惑，有些名词感觉前后表达的意思不容易对上号，甚至多看几遍之后，困惑愈深。不过最终我还是理了一个基本不差的脉络出来，如果有读者发现我表述中差错的地方，敬请指正。

1. 简介

谈到 GPU，人们首先想到的可能是「显卡」，进而想到「英伟达(NVIDIA)」。的确， GPU 的祖先便是图形加速器，用于辅助 CPU 做图形处理的工作，而黄仁勋创办的英伟达正是 GPU 领域的佼佼者，不断引领着 GPU 架构的发展革新。

我们知道，图形显示是由一个个细小的像素组合而成，在计算机的世界中，像素的变化即意味着一组固定宽度比特位所表示的参数的变化。因此，对一副图形进行变换，本质上是对成千上万个像素的参数进行计算的结果，而这其中必然存在大量的数据并行度。

GPU 天生是处理并行问题的好手，在它的体系结构中融合了线程并行、指令并行、SIMD 数据并行的多种并行处理形式，它可以概括为是一个由多个多线程 SIMD 处理器组成的 MIMD 处理器。

GPU 处理数据并行任务能有很好的效能比，但处理控制为主的任务则不够经济，因此 GPU 一直以来是作为 CPU 的外设而存在的。随着异构处理器的兴起，二者常常被集成在同一个处理器芯片中&