计算机组成与原理——GPU篇
文章平均质量分 92
芯片寻道者
这个作者很懒,什么都没留下…
展开
-
计算机组成与设计学习——GPU篇(六):浮点运算
本章介绍GPU的浮点运算单元。原创 2024-03-24 14:55:20 · 1682 阅读 · 1 评论 -
计算机组成与设计学习——GPU篇(五):并行存储子系统
除GPU本身外,内存子系统是决定图形系统性能的最重要因素。图形处理工作负载要求极高的内存读写传输速率。像素写入和混合(读取-修改-写入)操作、深度缓冲区的读写以及纹理贴图读取,再加上命令与对象顶点及属性数据的读取,构成了内存访问流量的大部分。原创 2024-02-16 12:49:08 · 1049 阅读 · 1 评论 -
计算机组成与设计学习——GPU篇(四):多线程多处理器架构_续
本节继续介绍多线程处理器的相关内容,聚焦多线程多处理器的指令集架构的设计与实例,最后比较SIMT与其他多处理器的不同,并作最后的总结。原创 2024-02-15 16:14:07 · 1063 阅读 · 1 评论 -
计算机组成与设计学习——GPU篇(四):多线程多处理器架构
为满足不同市场细分的需求,GPU 实现了可扩展数量的多处理器结构——实际上,GPU 本身就是由多个多处理器组成的多处理器。此外,每个多处理器都高度支持多线程,能够高效地执行大量细粒度的顶点着色器线程和像素着色器线程。一款基础质量优良的 GPU 拥有两到四个多处理器,而专为游戏发烧友或计算平台设计的 GPU 则拥有几十个这样的多处理器。本节将关注其中一个多线程多处理器架构,即 NVIDIA Tesla 流式多处理器(SM)的一个简化版本。原创 2024-02-13 19:37:41 · 1636 阅读 · 1 评论 -
计算机组成与设计学习——GPU篇(三):GPU编程
本节简要介绍如何使用图形API和编程语言来为实时图形应用程序编程GPU原创 2024-02-03 20:34:01 · 1758 阅读 · 1 评论 -
计算机组成与设计学习——GPU篇(三):GPU编程_续
CUDA、Brook 和 CAL 是专为 GPU 设计的编程接口,它们关注的是数据并行计算而非图形处理。CAL(Compute Abstraction Layer)是 AMD GPU 的低级汇编语言接口。Brook 是一种由 Buck 等人[2004]针对 GPU 改进的流式编程语言。CUDA 由 NVIDIA 公司[2007]开发,是对 C 和 C++ 语言的扩展,旨在实现多核 GPU 和多核 CPU 的可扩展并行编程。本节内容根据 Nickolls 等人[2008]的文章,描述了 CUDA 编程模型。原创 2024-02-08 21:09:56 · 1260 阅读 · 0 评论 -
计算机组成与设计学习——GPU篇(二):GPU系统架构
在本节中,我们将概述当前普遍使用的GPU系统架构。我们将讨论系统配置、GPU功能和服务、标准编程接口以及基本的GPU内部架构。原创 2024-01-21 23:30:22 · 1628 阅读 · 0 评论 -
计算机组成与设计学习——GPU篇(一)
这个专题主要专注于图形处理单元(GPU)的演变历史、系统架构、编程模型以及在计算和视觉计算领域的应用。原创 2024-01-21 19:59:58 · 1181 阅读 · 0 评论