GPU规格信息对比

GPU型号Tesla V100T4A100H100昇腾910BB200
发布时间201720182020202220232024
制程工艺12nm12nm7nm4nm (TSMC 4N)7nm4nm (3D封装)
计算核心5120 CUDA2560 CUDA6912 CUDA18432 CUDA4096 NPU24576 CUDA
FP16算力 (TFLOPS)112653127563201450
FP32算力 (TFLOPS)148.119.5672489
显存类型HBM2GDDR6HBM2eHBM3HBM2eHBM3e
显存容量32GB16GB80GB80GB64GB192GB
显存带宽900GB/s320GB/s2TB/s3TB/s1.5TB/s8TB/s
互连技术NVLink 2.0PCIe 3.0NVLink 3.0NVLink 4.0HCCS 2.0NVLink 5.0
互连带宽300GB/s16GB/s600GB/s900GB/s600GB/s1.8TB/s
功耗 (TDP)300W70W400W700W450W1200W (液冷)
软件栈CUDA 10+CUDA 11+CUDA 11+CUDA 12+CANN 6.0CUDA 13+
定位及特性首代Tensor Core,首次引入Tensor Core,支持FP16混合精度训练推理专用GPU,低功耗设计,强化INT8推理能力,GDDR6显存通用计算旗舰,支持TF32精度、MIG多实例切分、HBM2e显存AI超算专用,FP8精度支持、Transformer引擎、NVLink 4.0国产化AI项目替代方案万亿参数模型专用,第二代Transformer引擎、FP6精度、协同计算架构(CPU+GPU联合优化)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

飞翔的FOX

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值