一文搞懂最新NVIDIA GPU满血版和阉割版芯片：A100、H100、A800、H800、H20的差异

神马行空

已于 2025-02-27 10:58:34 修改

阅读量2w

点赞数 29

分类专栏： GPU芯片文章标签： AI编程 gpu算力

于 2025-02-18 15:07:20 首次发布

本文链接：https://blog.csdn.net/u013891230/article/details/145705022

版权

GPU芯片专栏收录该内容

2 篇文章

订阅专栏

二、A100、H100、A800、H800、H20差异对比

1. A100：数据中心AI计算的奠基石

2. H100：性能提升的算力王者

3. A800 & H800：中国市场专供版

4. H20：新一代受限算力GPU

一、NVIDIA GPU架构

1、Blackwell 架构

Blackwell 架构是 NVIDIA GPU 最新一代架构，2024 年 3 月发布。首次全面支持DisplayPort 2.1 UHBR20（80Gbps），突破DisplayPort 1.4a的限制。它们还将支持PCIe 5.0，成为首批实现这一转变的消费级GPU，不过我们还需观察这一支持是否覆盖所有Blackwell GPU，还是仅适用于RTX 5090。视频编码和解码功能也得到了增强，现在支持4:2:2视频流。

2、Hopper 架构

Hopper 架构是 NVIDIA GPU 的第九代架构，2022 年发布。相较于Ampere，Hopper 架构支持第四代Tensor Core，且采用新型流式处理器，每个 SM 能力更强。Hopper 架构在计算能力、深度学习加速和图形功能方面带来新的创新和改进。代表产品是H100、H800。

3、Ampere 架构

Ampere 架构是 NVIDIA GPU 的第八代架构，2020 年发布。Ampere 架构在计算能力、能效和深度学习性能方面都有重大提升。Ampere 架构的 GPU 采用了多个流多处理器（SM）和更大的总线宽度，提供了更多的 CUDA Core 和更高的频率。它还引入了第三代Tensor Core，提供更强大的深度学习计算性能。Ampere 架构的 GPU 还具有更高的内存容量和带宽，适用于大规模的数据处理和机器学习任务。代表产品是A100、A800、A30系列。

4、Turing 架构

Turing 架构是 NVIDIA GPU 的第七代架构，发布于 2018 年。Turing 架构引入了实时光线追踪（RTX）和深度学习超采样（DLSS）等重要功能。代表产品是T4、2080TI、RTX5000。

5、Volta 架构

Volta 架构是 NVIDIA GPU 的第六代架构，发布于 2017 年。Volta 架构专注于深度学习和人工智能应用，并引入了 Tensor Core。代表产品：V100、TiTan。

参考：NVIDIA 技术和 GPU 架构 | NVIDIA

二、A100、H100、A800、H800、H20差异对比

GPU型号	架构	CUDA核心数	Tensor核心数	显存（HBM）	带宽	NVLink	说明	主要用途	详细信息
A100	Ampere	6912	432	80G HBM2e	2.04 TB/s	支持	新一代专业计算卡皇，除了贵没缺点。显存大，非常适合做半精计算，因为有 NVLink 600 GB/s，多卡并行加速比非常高。需要使用 cuda11.x	AI训练、推理、HPC	NVIDIA A100 SXM4 80 GB Specs \| TechPowerUp GPU Database
H100	Hopper	14592	456	80G HBM2e	2.04 TB/s	支持	算力、带宽、显存都很好，就是目前在国内不容易买到而且贵	AI训练、HPC、Transformer Engine	NVIDIA H100 PCIe 80 GB Specs \| TechPowerUp GPU Database
A800	Ampere	6912	432	80G HBM2e	1.94 TB/s	400 GB/s	与 A100 相比，主要差别在其 NVLink 速度只有 400 GB/s	中国市场AI计算	NVIDIA A800 PCIe 80 GB Specs \| TechPowerUp GPU Database
H800	Hopper	14592	456	80G HBM2e	2.04 TB/s	受限	与 A100 性能好一些	中国市场大规模AI计算	NVIDIA H800 PCIe 80 GB Specs \| TechPowerUp GPU Database
H20	Hopper	未公布	未公布	预计 96G	受限 4 TB/s	预计 900GB/s	高缓存、高带宽，但是算力性能比非特供版低	中国市场AI训练和推理	NVIDIA Readying H20 AI GPU for Chinese Market \| TechPowerUp