常见GPU算力(V100,GV100)

一、硬件参数

V100 SXM2V100 PCIeV100S PCIe
核心GV100GV100GV100
架构VoltaVoltaVolta
SM808080
CUDA Cores / SM646464
CUDA Cores / GPU512051205120
FP32 Cores / SM646464
FP32 Cores / GPU512051205120
FP64 Cores / SM323232
FP64 Cores / GPU256025602560
INT32 Cores / SM646464
INT32 Cores / GPU512051205120
Tensor Core1st1st1st
Tensor Cores / SM888
Tensor Cores / GPU640640640
GPU 加速频率 (MHz)153013801597
显存16 / 32 GB HBM216 / 32 GB HBM232 GB HBM2
显存位宽 (bit)409640964096
显存带宽 (GBps)8978971133
一缓 (KB per SM)128128128
二缓 (MB)666
接口SXM2PCIe 3.0x16PCIe 3.0x16
TDP (W)300250250
制程TSMC 12nm FFNTSMC 12nm FFNTSMC 12nm FFN

        注意到,完整 GV100 核心有 6 组 GPC,每组 GPC 包含 7 组 TPC,单个 TPC 中含有两个 SM 单元,因此完整 GV100 核心共有 84 个 SM 单元,但 V100 的 GV100 核心只开启其中的 80 个。每个 SM 单元中有 64 个 CUDA 计算单元。每个 SM 单元中有 64 个 FP32 计算单元、64 个 INT32 计算单元和 32 个 FP64 计算单元。

        每个 SM 单元中有 8 个 Tensor Core,因此 V100 的 GV100 总共含有 640 个 Tensor Core。支持的数据类型只有 FP16。

二、算力

1、CUDA Core 算力

浮点:TFLOPS

整型:TIOPS

V100 SXM2V100 PCIeV100S PCIe
FP3215.6714.1316.35
FP1631.3328.2632.71
FP647.8347.0668.177
INT3215.6714.1316.35

2、Tensor Core 算力

浮点:TFLOPS

V100 SXM2V100 PCIeV100S PCIe
FP16125112130

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值