显卡 3090 vs v100

1.3090

  • Date: 2020 Ampere
  • Pielines/ Cuda cores: 10496

2.V100

  • Date: 2018 Volta
  • Pielines/ Cuda cores: 5129

3.结构 & Core比较:

  • v100优点:

    • v100功耗小
    • v100较快的双精度(fp64)和混合精度(fp16+fp32)
    • pcie版的NVLink与2080ti完全一致
  • v100缺点:

    • 不支持整数格式计算,即INT4、INT8, 即无量化推理能力, 除非上turing架构
    • 不支持半精度的bf16, 只支持fp16 (bf: Google brain floating point format, 可加快训练速度)
    • 不支持单精度fp32
    • 不支持awq量化、支持gptq量化
    • 不支持flash-attention、支持vllm

4. 理论性能(Theoretial Performance)

- 3090 vs. A100					NVIDIA RTX 3090    		NVIDIA A100 40 GB (PCIe)     Difference
- FP16 (half) performance    		35.58 TFLOPS    		77.97 TFLOPS    			 42.39 TFLOPS (119%)
- FP32 (float) performance    		35.58 TFLOPS    		19.49 TFLOPS    			 16.09 TFLOPS (-45%)
- FP64 (double) performance    		556 GFLOPS    			9746 GFLOPS    		 		 9190 GFLOPS (1653%)
- Pixel Rate    					189.8 GPixel/s    		225.6 GPixel/s    			 35.8 GPixel/s (19%)
- Texture Rate    					556 GTexel/s    		609.1 GTexel/s    			 53.1 GTexel/s (10%)
  • 多类N卡比较
    在这里插入图片描述

4.性能详细对比

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Reference

  • https://technical.city/en/video/GeForce-RTX-3090-vs-Tesla-V100-PCIe-32-GB
  • https://zhuanlan.zhihu.com/p/667255235
  • https://bizon-tech.com/gpu-benchmarks/NVIDIA-RTX-3090-vs-NVIDIA-A100-40-GB-(PCIe)/579vs592
  • https://www.bilibili.com/read/cv33373992/?from=readlist
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值