英伟达RTX 5090功耗高达600W!32G显存,核心比5080多一倍!

点击下方卡片,关注“CVer”公众号

AI/CV重磅干货,第一时间送达

点击进入—>【Mamba/多模态/扩散】交流群

添加微信号:CVer111,小助手会拉你进群!

扫描下方二维码,加入CVer学术星球!可以获得最新顶会/顶刊上的论文idea和CV从入门到精通资料,及最前沿应用!发论文/搞科研/涨薪,强烈推荐!

97cd88504e0999f0e5974963a8e952a1.png

转载自:机器之心 |编辑:泽南、小舟

RTX 50 系列的发布日期可能会在明年初。

英伟达的 RTX 50 系列会整出什么新活?

随着芯片发布日期的临近,人们的猜测也越来越密集起来。最近,海外知名爆料者 Kopite7kimi 放出了 GeForce RTX 5080 和 GeForce RTX 5090 显卡的初步规格信息,让我们对新 GPU 有了一些初步的概念。

如果消息正确,那么英伟达即将推出的 GeForce RTX 5090 将是一款拥有 600W 额定功率(TGP)的怪物。这些规格中的许多与之前的曝光内容一致,不过也有一些新的消息。

ffe07b55f14444a44ebbf2e5e94e28c8.png

根据最新消息,用于台式电脑的旗舰 Blackwell 架构 GPU RTX 5090 预计将基于 GB202 图形处理器,配备 21760 个 CUDA 核心,使用 512 位接口与 32GB GDDR7 内存组合。如果消息准确,如此多的 FP32 核心将有大量功耗 —— 高达 600W(比 RTX 4090 高出 150W)。即使最终规格最终略逊一筹,这款显卡在发布时肯定会跻身 GPU 性能金字塔顶端。只是不要问价格……

相比之下,由 GB203 GPU 驱动的 RTX 5080 性能就要差上很多,据说它将配备 10752 个 CUDA 核心,大约是顶级产品的一半。RTX 5080 显卡预计将配备 16GB GDDR7 显存和 256 位接口,TGP 额定功率为 400W(RTX 4080 是 320W)。借助 GDDR7 带来的可观带宽提升,RTX 5080 在高分辨率下的表现应该会远超其前代产品,也会是一款强大的显卡。

Nvidia GeForce RTX 5000 系列显卡的初步规格:

0e44ebe2190b38f83737c2745f402300.png

虽然 GeForce RTX 5090 潜在的巨大性能确实引起了人们的关注,但另一件引人注目的事情是旗舰 RTX 5090 与 RTX 5080 之间的巨大性能差距。就流处理器和内存接口的数量而言,80 的规格几乎是 90 的一半。TGP 将是顶级卡的三分之二,因此 5080 时钟频率可能会更高以试图缩小与 5090 的差距,这代表着比 40 系列 GPU 型号之间更大的差异。

这种性能差异看起来很奇怪,可能表明英伟达希望尝试创造新的性能分层,或者限制某些消费卡作为人工智能计算替代品的吸引力。

纸面数据上,RTX 4090 比 RTX 4080 提供多 68% 的 GPU 核心、多 50% 的 VRAM、多 41% 的内存带宽以及多 13% 的 L2 缓存,CPU 的限制使 4090 性能无法倍杀,但在 4K 时 ultra 画面的任务上它最终会比第二级 40 系列 GPU 快了约 35%,而 RTX 3090 仅比 RTX 3080 快了约 15%。

而如果现在这些规格正确的话,RTX 5090 的性能可能高达 4080 的两倍。

虽然不能确定英伟达为什么决定以这种方式构建其下一代产品线,但可能的技术解释之一是英伟达的 GB202 处理器可能由两个 GB203 芯片组成。Blackwell GPU 使用多芯片设计的传闻已经有一段时间了,GB100/GB200 等数据中心 GPU 确实采用了这种架构。然而,使用 CoWoS-L 封装来实现消费级芯片之间的高速(~10 TB/s)互连似乎是一个非常昂贵的想法。

构建多芯片 GPU 的另一种方法是采用台积电 4 纳米级工艺技术构建具有超过 21760 个 CUDA 核心的单片图形处理器,这将产生约 650 mm^2 的芯片。

由于芯片尺寸较大,这种设计很难生产,这就是为什么通常会出现冗余的原因 —— 例如,4090 的 AD102 芯片最多有 144 个流多处理器 (SM),但仅启用了 128 个。因此,如果英伟达愿意的话,走这条路也不是不可能的。然而,单片芯片也非常昂贵,而且 RTX 5080 和 RTX 5090 之间存在如此巨大的差距会很奇怪。不过,其他 GPU 可以尝试填补这些漏洞,我们最终可能会看到后续型号可能有大约 18000 个可用的 CUDA 核心。

我们所能知道的是,英伟达在各种产品中使用相同的芯片:不论是台式机、笔记本还是专业和数据中心 GPU 都基于相同的硅片设计。

由于 AI 产业目前如此火热,英伟达很大程度上已将精力转为主攻数据中心产品,然后以其作为基础,面向消费者产品进行改款。如果是这样的话,如果 RTX 5090 最终定价比已经很贵的 4090 高出不少,你也不要感到惊讶 —— 我们甚至可能会看到 AI 专用变体在消费者型号之前问世。

目前,我们掌握的 Blackwell 架构 PC 显卡的所有信息都是非官方的。在英伟达直接发表任何言论之前,事情可能会发生变化。关于发布日期也存在相互矛盾的谣言,有人说 RTX 50 系列要到 2025 年初才会上市。如果这种说法正确的话,这将为在发布前继续调整配置提供充足的时间。

参考内容:

https://www.tomshardware.com/pc-components/gpus/leak-claims-rtx-5090-has-600w-tgp-rtx-5080-hits-400w-up-to-21760-cores-32gb-vram-512-bit-bus

https://wccftech.com/nvidia-geforce-rtx-5090-32-gb-rtx-5080-16-gb-specs-5090-20k-cores-600w-5080-10k-cores-400w/

 
 

何恺明在MIT授课的课件PPT下载

 
 

在CVer公众号后台回复:何恺明,即可下载本课程的所有566页课件PPT!赶紧学起来!

ECCV 2024 论文和代码下载

在CVer公众号后台回复:ECCV2024,即可下载ECCV 2024论文和代码开源的论文合集

CVPR 2024 论文和代码下载

在CVer公众号后台回复:CVPR2024,即可下载CVPR 2024论文和代码开源的论文合集

Mamba、多模态和扩散模型交流群成立

 
 
扫描下方二维码,或者添加微信号:CVer111,即可添加CVer小助手微信,便可申请加入CVer-Mamba、多模态学习或者扩散模型微信交流群。另外其他垂直方向已涵盖:目标检测、图像分割、目标跟踪、人脸检测&识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝&压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿&交流、PyTorch、TensorFlow和Transformer、NeRF、3DGS、Mamba等。
一定要备注:研究方向+地点+学校/公司+昵称(如Mamba、多模态学习或者扩散模型+上海+上交+卡卡),根据格式备注,可更快被通过且邀请进群

 
 
▲扫码或加微信号: CVer111,进交流群
CVer计算机视觉(知识星球)来了!想要了解最新最快最好的CV/DL/AI论文速递、优质实战项目、AI行业前沿、从入门到精通学习教程等资料,欢迎扫描下方二维码,加入CVer计算机视觉(知识星球),已汇集上万人!

▲扫码加入星球学习
 
 
▲点击上方卡片,关注CVer公众号
整理不易,请赞和在看
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值