A100计算能力
A100 GPU支持新的计算功能8.0。表1比较了NVIDIA GPU架构的不同计算功能的参数。
数据中心GPU NVIDIA Tesla P100 NVIDIA Tesla V100 NVIDIA A100
GPU代号 GP100 GV100 GA100
GPU架构 NVIDIA Pascal NVIDIA Volta NVIDIA安培
计算能力 6.0 7.0 8.0
线/经线 32 32 32
最大warp/ SM 64 64 64
最大线程数/ SM 2048 2048 2048
最大线程块/ SM 32 32 32
最多32位寄存器/ SM 65536 65536 65536
最大寄存器/块 65536 65536 65536
最大寄存器/线程 255 255 255
最大块尺寸 1024 1024 1024
FP32核心/ SM 64 64 64
SM寄存器与FP32内核的比率 1024 1024 1024
共享内存大小/ SM 64 KB 最多可配置96 KB 最多可配置164 KB
表1.计算能力:GP100 vs. GV100 vs. GA100。
MIG架构
尽管许多数据中心的工作量在规模和复杂性上都在继续扩展,但某些加速任务的要求却不高,例如早期开发或推断小批量的简单模型。数据中心经理的目标是保持较高的资源利用率,因此理想的数据中心加速器不仅会变大,还会有效地加速许多较小的工作负载。
新的MIG功能可以将每个A100划分为多达七个GPU实例,以实现最佳利用率,从而有效地扩展对每个用户和应用程序的访问权限。
图10显示了Volta MPS如何允许多个应