英伟达AD102核心和RTX4090显卡规格对比，电路板PCB和dieshot分析，显卡功耗计算方法...

启芯硬件笔记

已于 2024-12-28 23:18:24 修改

阅读量2.3k

点赞数 17

分类专栏：显卡GPU 硬件电路分析文章标签：智能电视人工智能 CHIPLET 芯片设计英伟达 GPU

于 2024-12-08 10:42:28 首次发布

本文链接：https://blog.csdn.net/tianxiaer359/article/details/144336198

版权

硬件电路分析同时被 2 个专栏收录

77 篇文章

订阅专栏

显卡GPU

6 篇文章

订阅专栏

2022年英伟达推出了全新的AD102核心，特别是用于RTX 4090显卡的版本（满血版本）

采用台积电N4 4nm工艺的RTX 40系列显卡的晶体管数量最多可达750亿，是上一代GA102核心的2.65倍

1-小知识：台积电的N4工艺和4N工艺有什么区别？

台积电的N4工艺和4N工艺是两种不同的制程技术，其中

N4工艺：可以简单理解，N4工艺是台积电的更新4N制程技术之一，采用了3nm级别的制程节点。这意味着N4工艺比4N工艺更先进，具有更高的集成度和性能。

4N工艺：4N工艺是台积电更成熟的顶尖制程技术之一，采用了4nm级别的制程节点。虽然比N4工艺稍旧，但仍然是业界领先的制程技术之一。

性能和能效比。由于N4工艺比4N工艺更新，因此通常具有更好的性能和能效比。N4工艺提供了更高的集成度，更低的功耗和更高的性能，使得芯片可以在更小的尺寸上实现更多的功能。

说完工艺差别，再回到显卡核心规格上，满血版的AD102最多拥有18432个CUDA核心。

AD102、AD103、以及AD104三款芯片的面积分别为608mm²、378.6mm²和294.5mm²，对应的晶体管数量分别为763亿、459亿和358亿个。AD103和AD104晶体管密度一致，AD102晶体管密度稍微再高一些。从数量上来看，AD104的晶体管数量比GA102还要多出75亿个。

对比表格如下

作为 RTX 30 系列 Ampere GPU 的继任者，RTX 40 系列 Ada Lovelace 旗舰 GPU（AD102）将拥有 144 组 SM 单元 / 18000+ CUDA 核心。

其次 AD103 GPU 拥有 84 组 SM 单元，AD104 / 106 / 107 分别具有 60 / 36 / 24 组 SM 单元。

2-相比与上一代，主要有以下的优化

1. 制程工艺

AD102核心采用了台积电（TSMC）的4纳米工艺制造，这使得晶体管的数量达到了惊人的763亿颗。这一先进的制程工艺不仅提供了出色的性能，还将功耗控制在合理范围内。

2. 强大的CUDA核心

这款核心拥有18432个CUDA核心，为用户提供卓越的图形处理能力。无论是进行游戏、视频编辑还是深度学习任务，AD102核心都能轻松胜任。

3. 光线追踪与深度学习

AD102核心支持光线追踪技术，这意味着游戏画面将更加真实、细致。同时，它还集成了576个第四代Tensor核心和144个第三代RT核心，为深度学习任务提供了强大的计算能力。

4. 高频率性能

AD102核心的基础频率为1.8GHz，加速频率达到了2.2GHz，这保证了在各种应用和工作负载下都能表现出色。此外，它的最大功耗为500W，为用户提供了充足的性能储备。

3-AD102核心的市场地位

AD102核心是目前市场上最强大的单芯片GPU之一，它的性能在图形处理领域创下了新的巅峰。这款核心的发布，让英伟达继续保持了在GPU市场的领先地位，吸引了众多科技爱好者和专业用户的关注。

规格方面，英伟达 AD102 GPU 将拥有 18432 个 CUDA 内核，支持 384 bit 位宽的 GDDR6X 显存。RTX 4090 将搭载 AD102 GPU，但只启用 16384 个 CUDA 内核。未来，英伟达可能推出 RTX 4090 Ti 或者是 TITAN 型号，启用更多的 CUDA 核心。

搜索这一颗物料3MU47 D8bzc MICRO

另一个更新是，NVIDIA安培显卡的单12pin外接供电接口。相较于目前常见的6+6pin、8+6pin等外接供电，单12pin采用12V供电，6pin为12V，6pin为接地，按照经验数据，单pin载流6~8.5A，也就是最大600瓦，最少也有400瓦。

Nvidia的GeForce RTX 4090 Ti型号PG136 / 139-SKU310具有AD102 GPU，具有18176个CUDA内核，96M L2缓存和384位内存总线。与具有48GB内存的专业和面向数据中心的RTX 6000 Ada一代显卡不同，针对游戏玩家和专业消费者的产品将“仅”携带24GB的GDDR6X内存，数据传输速度为24 GT / s，这对于所有游戏来说已经足够了，至少目前是这样。