2022年英伟达推出了全新的AD102核心,特别是用于RTX 4090显卡的版本(满血版本)
采用台积电N4 4nm工艺的RTX 40系列显卡的晶体管数量最多可达750亿,是上一代GA102核心的2.65倍
1-小知识:台积电的N4工艺和4N工艺有什么区别?
台积电的N4工艺和4N工艺是两种不同的制程技术,其中
N4工艺:可以简单理解,N4工艺是台积电的更新4N制程技术之一,采用了3nm级别的制程节点。这意味着N4工艺比4N工艺更先进,具有更高的集成度和性能。
4N工艺:4N工艺是台积电更成熟的顶尖制程技术之一,采用了4nm级别的制程节点。虽然比N4工艺稍旧,但仍然是业界领先的制程技术之一。
性能和能效比。由于N4工艺比4N工艺更新,因此通常具有更好的性能和能效比。N4工艺提供了更高的集成度,更低的功耗和更高的性能,使得芯片可以在更小的尺寸上实现更多的功能。
说完工艺差别,再回到显卡核心规格上,满血版的AD102最多拥有18432个CUDA核心。
AD102、AD103、以及AD104三款芯片的面积分别为608mm²、378.6mm²和294.5mm²,对应的晶体管数量分别为763亿、459亿和358亿个。AD103和AD104晶体管密度一致,AD102晶体管密度稍微再高一些。从数量上来看,AD104的晶体管数量比GA102还要多出75亿个。
对比表格如下
作为 RTX 30 系列 Ampere GPU 的继任者,RTX 40 系列 Ada Lovelace 旗舰 GPU(AD102)将拥有 144 组 SM 单元 / 18000+ CUDA 核心。
其次 AD103 GPU 拥有 84 组 SM 单元,AD104 / 106 / 107 分别具有 60 / 36 / 24 组 SM 单元。
2-相比与上一代,主要有以下的优化
1. 制程工艺
AD102核心采用了台积电(TSMC)的4纳米工艺制造,这使得晶体管的数量达到了惊人的763亿颗。这一先进的制程工艺不仅提供了出色的性能,还将功耗控制在合理范围内。
2. 强大的CUDA核心
这款核心拥有18432个CUDA核心,为用户提供卓越的图形处理能力。无论是进行游戏、视频编辑还是深度学习任务,AD102核心都能轻松胜任。
3. 光线追踪与深度学习
AD102核心支持光线追踪技术,这意味着游戏画面将更加真实、细致。同时,它还集成了576个第四代Tensor核心和144个第三代RT核心,为深度学习任务提供了强大的计算能力。
4. 高频率性能
AD102核心的基础频率为1.8GHz,加速频率达到了2.2GHz,这保证了在各种应用和工作负载下都能表现出色。此外,它的最大功耗为500W,为用户提供了充足的性能储备。
3-AD102核心的市场地位
AD102核心是目前市场上最强大的单芯片GPU之一,它的性能在图形处理领域创下了新的巅峰。这款核心的发布,让英伟达继续保持了在GPU市场的领先地位,吸引了众多科技爱好者和专业用户的关注。
规格方面,英伟达 AD102 GPU 将拥有 18432 个 CUDA 内核,支持 384 bit 位宽的 GDDR6X 显存。RTX 4090 将搭载 AD102 GPU,但只启用 16384 个 CUDA 内核。未来,英伟达可能推出 RTX 4090 Ti 或者是 TITAN 型号,启用更多的 CUDA 核心。
搜索这一颗物料3MU47 D8bzc MICRO
另一个更新是,NVIDIA安培显卡的单12pin外接供电接口。相较于目前常见的6+6pin、8+6pin等外接供电,单12pin采用12V供电,6pin为12V,6pin为接地,按照经验数据,单pin载流6~8.5A,也就是最大600瓦,最少也有400瓦。
Nvidia的GeForce RTX 4090 Ti型号PG136 / 139-SKU310具有AD102 GPU,具有18176个CUDA内核,96M L2缓存和384位内存总线。与具有48GB内存的专业和面向数据中心的RTX 6000 Ada一代显卡不同,针对游戏玩家和专业消费者的产品将“仅”携带24GB的GDDR6X内存,数据传输速度为24 GT / s,这对于所有游戏来说已经足够了,至少目前是这样。
4-PCIe显卡功耗估算方法
最后,推荐一个PCIe卡功耗估算方法如下:
但PCIe插槽为:75W+15W=90W
一个8PIN座子---150W 两个300W
一个12pin座子可能相当于两个8PIN,也就是最多600W
以上的功耗估算方法,基本可以用于所有的PCIE设备。