常见GPU算力(2080Ti,TU102-300A)

一、硬件参数

核心TU102-300A
架构Turing
SM68
CUDA Cores / SM64
CUDA Cores / GPU4352
Tensor Cores / SM8 (2nd Gen)
Tensor Cores / GPU544 (2nd Gen)
GPU 加速频率1545 MHz
显存11 / 22 GB (GDDR6)*
显存位宽352 bit
显存速率14 Gbps
显存带宽616 GBps
一缓64 KB (per SM)
二缓6 MB
TGP250 W
制程TSMC 12nm FFN

* 22 GB 是常见的手动扩显存的魔改卡

        注意到,完整 TU102 核心共有 6 组 GPC,每组 GPC 包含 6 组 TPC,单个 TPC 中含有两个 SM 单元,因此完整 TU102 核心共有 72 个 SM 单元,但 TU102-300A 只开启其中的 68 个。每个 SM 单元中有 64 个 CUDA 计算单元。每个 SM 单元中有 64 个 FP32 计算单元、64 个 INT32 计算单元和 2 个 FP64 计算单元。

        每个 SM 单元中有 8 个 Tensor Core,因此 TU102-300A 总共含有 544 个 Tensor Core。支持的数据类型有 FP16、INT8、INT4,不支持 FP64、BF16、TF32。

二、算力

1、CUDA Core 算力

浮点:TFLOPS

整型:TIOPS

FP3213.45
FP1626.9
FP640.4202
INT3213.45

2、Tensor Core 算力

浮点:TFLOPS

整型:TIOPS

FP16107.6
INT8215.2
INT4430.3

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值