英伟达RTX 5090功耗高达600W！32G显存，核心比5080多一倍！-CSDN博客

点击下方卡片，关注“CVer”公众号

AI/CV重磅干货，第一时间送达

点击进入—>【Mamba/多模态/扩散】交流群

添加微信号：CVer111，小助手会拉你进群！

扫描下方二维码，加入CVer学术星球！可以获得最新顶会/顶刊上的论文idea和CV从入门到精通资料，及最前沿应用！发论文/搞科研/涨薪，强烈推荐！

转载自：机器之心｜编辑：泽南、小舟

RTX 50 系列的发布日期可能会在明年初。

英伟达的 RTX 50 系列会整出什么新活？

随着芯片发布日期的临近，人们的猜测也越来越密集起来。最近，海外知名爆料者 Kopite7kimi 放出了 GeForce RTX 5080 和 GeForce RTX 5090 显卡的初步规格信息，让我们对新 GPU 有了一些初步的概念。

如果消息正确，那么英伟达即将推出的 GeForce RTX 5090 将是一款拥有 600W 额定功率（TGP）的怪物。这些规格中的许多与之前的曝光内容一致，不过也有一些新的消息。

根据最新消息，用于台式电脑的旗舰 Blackwell 架构 GPU RTX 5090 预计将基于 GB202 图形处理器，配备 21760 个 CUDA 核心，使用 512 位接口与 32GB GDDR7 内存组合。如果消息准确，如此多的 FP32 核心将有大量功耗 —— 高达 600W（比 RTX 4090 高出 150W）。即使最终规格最终略逊一筹，这款显卡在发布时肯定会跻身 GPU 性能金字塔顶端。只是不要问价格……

相比之下，由 GB203 GPU 驱动的 RTX 5080 性能就要差上很多，据说它将配备 10752 个 CUDA 核心，大约是顶级产品的一半。RTX 5080 显卡预计将配备 16GB GDDR7 显存和 256 位接口，TGP 额定功率为 400W（RTX 4080 是 320W）。借助 GDDR7 带来的可观带宽提升，RTX 5080 在高分辨率下的表现应该会远超其前代产品，也会是一款强大的显卡。

Nvidia GeForce RTX 5000 系列显卡的初步规格：

虽然 GeForce RTX 5090 潜在的巨大性能确实引起了人们的关注，但另一件引人注目的事情是旗舰 RTX 5090 与 RTX 5080 之间的巨大性能差距。就流处理器和内存接口的数量而言，80 的规格几乎是 90 的一半。TGP 将是顶级卡的三分之二，因此 5080 时钟频率可能会更高以试图缩小与 5090 的差距，这代表着比 40 系列 GPU 型号之间更大的差异。

这种性能差异看起来很奇怪，可能表明英伟达希望尝试创造新的性能分层，或者限制某些消费卡作为人工智能计算替代品的吸引力。

纸面数据上，RTX 4090 比 RTX 4080 提供多 68% 的 GPU 核心、多 50% 的 VRAM、多 41% 的内存带宽以及多 13% 的 L2 缓存，CPU 的限制使 4090 性能无法倍杀，但在 4K 时 ultra 画面的任务上它最终会比第二级 40 系列 GPU 快了约 35%，而 RTX 3090 仅比 RTX 3080 快了约 15%。

而如果现在这些规格正确的话，RTX 5090 的性能可能高达 4080 的两倍。

虽然不能确定英伟达为什么决定以这种方式构建其下一代产品线，但可能的技术解释之一是英伟达的 GB202 处理器可能由两个 GB203 芯片组成。Blackwell GPU 使用多芯片设计的传闻已经有一段时间了，GB100/GB200 等数据中心 GPU 确实采用了这种架构。然而，使用 CoWoS-L 封装来实现消费级芯片之间的高速（~10 TB/s）互连似乎是一个非常昂贵的想法。

构建多芯片 GPU 的另一种方法是采用台积电 4 纳米级工艺技术构建具有超过 21760 个 CUDA 核心的单片图形处理器，这将产生约 650 mm^2 的芯片。

由于芯片尺寸较大，这种设计很难生产，这就是为什么通常会出现冗余的原因 —— 例如，4090 的 AD102 芯片最多有 144 个流多处理器 (SM)，但仅启用了 128 个。因此，如果英伟达愿意的话，走这条路也不是不可能的。然而，单片芯片也非常昂贵，而且 RTX 5080 和 RTX 5090 之间存在如此巨大的差距会很奇怪。不过，其他 GPU 可以尝试填补这些漏洞，我们最终可能会看到后续型号可能有大约 18000 个可用的 CUDA 核心。

我们所能知道的是，英伟达在各种产品中使用相同的芯片：不论是台式机、笔记本还是专业和数据中心 GPU 都基于相同的硅片设计。

由于 AI 产业目前如此火热，英伟达很大程度上已将精力转为主攻数据中心产品，然后以其作为基础，面向消费者产品进行改款。如果是这样的话，如果 RTX 5090 最终定价比已经很贵的 4090 高出不少，你也不要感到惊讶 —— 我们甚至可能会看到 AI 专用变体在消费者型号之前问世。

目前，我们掌握的 Blackwell 架构 PC 显卡的所有信息都是非官方的。在英伟达直接发表任何言论之前，事情可能会发生变化。关于发布日期也存在相互矛盾的谣言，有人说 RTX 50 系列要到 2025 年初才会上市。如果这种说法正确的话，这将为在发布前继续调整配置提供充足的时间。

参考内容：

https://www.tomshardware.com/pc-components/gpus/leak-claims-rtx-5090-has-600w-tgp-rtx-5080-hits-400w-up-to-21760-cores-32gb-vram-512-bit-bus

https://wccftech.com/nvidia-geforce-rtx-5090-32-gb-rtx-5080-16-gb-specs-5090-20k-cores-600w-5080-10k-cores-400w/

何恺明在MIT授课的课件PPT下载

在CVer公众号后台回复：何恺明，即可下载本课程的所有566页课件PPT！赶紧学起来！

ECCV 2024 论文和代码下载

在CVer公众号后台回复：ECCV2024，即可下载ECCV 2024论文和代码开源的论文合集

CVPR 2024 论文和代码下载

在CVer公众号后台回复：CVPR2024，即可下载CVPR 2024论文和代码开源的论文合集

Mamba、多模态和扩散模型交流群成立

扫描下方二维码，或者添加微信号：CVer111，即可添加CVer小助手微信，便可申请加入CVer-Mamba、多模态学习或者扩散模型微信交流群。另外其他垂直方向已涵盖：目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF、3DGS、Mamba等。
一定要备注：研究方向+地点+学校/公司+昵称（如Mamba、多模态学习或者扩散模型+上海+上交+卡卡），根据格式备注，可更快被通过且邀请进群

▲扫码或加微信号: CVer111，进交流群
CVer计算机视觉（知识星球）来了！想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料，欢迎扫描下方二维码，加入CVer计算机视觉（知识星球），已汇集上万人！

▲扫码加入星球学习

▲点击上方卡片，关注CVer公众号
整理不易，请赞和在看