GPU 架构及 Pascal GPU

最新推荐文章于 2024-06-16 16:17:17 发布

__Sunny__

最新推荐文章于 2024-06-16 16:17:17 发布

阅读量2.4k

点赞数 3

分类专栏： CUDA 文章标签： gpu

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/s_sunnyy/article/details/58605993

版权

本文介绍了NVIDIA的Pascal GPU架构，包括GPU的整体结构和SM详细结构。Pascal架构的GP100拥有60个SM，每个SM包含64个CUDA核心，支持高性能低功耗特性，提供单精度、双精度和半精度计算，采用16纳米FinFET工艺，具有HBM2高速内存架构，带宽高达720GB/s，并引入了NVLink高速互联技术和计算抢占功能。

摘要由CSDN通过智能技术生成

GPU 架构

　　NVIDIA 的 GPU 计算产品被称作 Tesla，这是从第一代针对 GPU 计算的 G80（Tesla 8，当时的 GPU 微架构也叫 Tesla）开始，NVIDIA 将传统微架构意义上的内核称作 streaming multiprocessor，简称 SM 或 SMX，SM 对来自并行运行的众多线程的指令进行创建、管理、调度和执行，而“内核”这个称呼则被 NVIDIA 用作 SIMD 中单个处理单元。（参考）

GPU 整体结构

Streaming Multiprocessor(SM)
- A set of CUDA cores (SP)
- 其他资源
Global memory

SM 结构

控制单元
- Warp 调度器
- 指令分发器
执行单元
- CUDA cores/SP
- special function units (SFU)
- load/store units (LD/ST)
Memory
- 64K 32-bit registers
- Cache
  - Texture/Constant memory
  - L1 Cache
  - Shared memory

最低0.47元/天解锁文章

关注

3
点赞
踩
8

收藏

觉得还不错? 一键收藏
1
评论
GPU 架构及 Pascal GPU

GPU 架构　　NVIDIA 的 GPU 计算产品被称作 Tesla，这是从第一代针对 GPU 计算的 G80（Tesla 8，当时的 GPU 微架构也叫 Tesla）开始，NVIDIA 将传统微架构意义上的内核称作 streaming multiprocessor，简称 SM 或 SMX，SM 对来自并行运行的众多线程的指令进行创建、管理、调度和执行，而“内核”这个称呼则被 NVIDIA 用作 S
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。