N卡 英伟达Nvidia 显卡及其计算能力(Compute Capability)表

N卡 英伟达Nvidia 显卡及其计算能力(Compute Capability)表

某些库或软件对显卡算力有要求,可参考下表核对。
比如:AWQ量化模型不支持算力小于7.5的显卡

V100:ValueError: The quantization method awq is not supported for the current GPU. Minimum capability: 75. Current capability: 70.

在这里插入图片描述

### NVIDIAGPU 型号列 NVIDIA 提供了一系列专为高性能计设计的 GPU,这些设备广泛应用于科学计、机器学习、数据分析等领域。以下是部分主流的计GPU 型号: #### Tesla 系列 Tesla 是 NVIDIA 早期推出的专注于加速计的产品线。 - **K80**: 双 GK210 芯片, 支持 CUDA Compute Capability 3.7[^2] - **P100**: 单颗 Pascal 架构 GP100 芯片, 支持 NVLink 技术, CUDA Compute Capability 6.0 #### Quadro 系列 Quadro 主要面向专业图形处理领域,但也具备强大的计性能。 - **RTX A6000**: GA102 Ampere 架构核心, CUDA Cores 数量达到 10752 个, Tensor Core 达到 336 个 - **GV100 (Volta)**: GV100 Volta 架构核心, 配备 5120 个 CUDA 核心以及 640 个 Tensor Core #### DGX 系列 DGX 系列为深度学习优化的一体机解决方案,内置多张顶级计。 - **DGX A100**: 搭载八块 A100 PCIe 显卡, 总计拥有 40GB 或者 80GB HBM2E 显存容量选项, CUDA Cores 和 Tensor Cores 的数量非常可观 #### 数据中心级产品 针对大规模数据中心部署而设计的专业级别显卡。 - **A100**: 安培架构旗舰款, 支持第三代 TensorCore 技术, FP32 吞吐量高达 19.5 TFLOPS - **V100S**: Volta 架构升级版 V100, 在原有基础上进一步提升了单精度浮点运和内存带宽 对于希望从事科学研究或企业级应用开发的人来说,上述列举出来的几类 GPU 将会是非常不错的选择。每一代新产品都会带来更高效的并行处理能与更低能耗现。 ```python # Python 示例代码展示如何获取当前系统中的 NVIDIA GPU 设备信息 import nvidia_smi nvidia_smi.nvmlInit() handle = nvidia_smi.nvmlDeviceGetHandleByIndex(0) info = nvidia_smi.nvmlDeviceGetMemoryInfo(handle) print(f'GPU Memory Usage:') print(f'Total : {info.total}') print(f'Free : {info.free}') print(f'Used : {info.used}') nvidia_smi.nvmlShutdown() ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值