经典文章翻译
文章平均质量分 92
积小流哥
数字芯片前端设计,专注图像处理加速器,risc-v处理器设计。
展开
-
通过“microbenchmark”解谜GPU的微架构
摘要在处理某些非图形计算任务时,图形处理器(GPU)仍然比传统的处理器快了几个数量级。因为GPU通常提供了类似C语言的编程抽象模型(比如Nvidia的CUDA),外界对GPU的了解一般仅限于芯片供应商的数据手册。本文提出了一种称为“微基准”的套件,并且运用这个套件测量了CUDA编程模型中的Nvidia GT200(GTX280)的架构。众多未经官方披露的特性都进行了测试,包括元素处理、memory层级等等。这种分析揭露了一些可能会影响编程性能和正确性的特点,分析结果对提升编程性能、分析和...翻译 2021-10-29 19:58:04 · 2089 阅读 · 2 评论 -
SIMD<SIMT<SMT: NVIDIA GPU的并行机制
原文出处:SIMD < SIMT < SMT: parallelism in NVIDIA GPUs一、概述 英伟达GPU称为它们的并行编程模型为SIMT(Single Instruction,Multiple Threads)。与我们熟知的SIMD(Single Instruction,Multiple Data)以及SMT(Simultaneous Multithreading)相比,SIMT带来了一些新的特性,在并行机制上总结如下:...翻译 2021-09-17 17:38:43 · 5427 阅读 · 1 评论