Nvidia推出RTX 50 Blackwell GPU：2000美元RTX 5090，1000美元RTX 5080，RTX 5070 / Ti为549美元和749美元

本文链接：https://blog.csdn.net/weixin_50197960/article/details/144986381

英伟达终于发布了全新的GeForce 50系列显卡，以及DLSS 4技术。此次共推出了四款高端GPU，不久后大家就能亲身体验到这些新品了。RTX 5080和RTX 5090将于1月30日率先上市，而RTX 5070和RTX 5070 Ti则会在2月面世。现在，是时候分享我们在2025年国际消费类电子产品展览会（CES）主题演讲中所获知的各项信息了，包括所有规格、价格以及性能表现。
在这里插入图片描述

新GPU

全新的RTX 5090旗舰显卡相较于上一代产品，硬件性能大幅提升。它不仅采用了英伟达最新的Blackwell架构，还拥有更多的CUDA核心、更高的内存带宽以及更大的显存容量。SM（流多处理器）数量从RTX 4090的128个增加到RTX 5090的170个，核心规模提升了33%。不过，GPU加速频率略有下降，从2.5 GHz降至2.4 GHz。

内存子系统经过全面优化，现在配备了512位宽的GDDR7技术。GDDR7内存时钟频率为28 Gbps，使得内存带宽高达1,792 GB/s，较RTX 4090的带宽提升了近80%。此外，该显卡还配备了32GB显存，这是英伟达在消费级显卡上提供的最大显存容量。
在这里插入图片描述
由于Blackwell仍然采用台积电4nm工艺制造，因此为容纳这些核心和内存，其板卡功耗已提升至惊人的575W，比RTX 4090高出28%。
RTX 5080则采用了较小的GPU配置，基于完全不同的GPU芯片，仅有84个SM，比上一代RTX 4080 Super多出4个。
在这里插入图片描述
该型号几乎所有方面的配置都是RTX 5090的一半：CUDA核心数量接近一半，内存位宽减半至256位，显存容量减半至16GB，通过30 Gbps的GDDR7内存实现略高于一半的内存带宽，即960 GB/s。从历史配置来看，这一规格更接近于RTX 5070级别的显卡，因此将其定位为5080对玩家来说有些失望。
在这里插入图片描述
RTX 5070 Ti进一步缩减，配备了70个SM，比上一代RTX 4070 Ti Super多出4个。不过，加速频率从2.61 GHz降至2.45 GHz。其内存位宽与RTX 5080保持一致，同为256位，因此也配备了16GB的GDDR7内存。此次，内存时钟频率为28 Gbps，带宽为896 GB/s。RTX 5070 Ti的功耗为300W，而RTX 5080的功耗为360W。

至于RTX 5070，它配备了48个SM，仅比上一代RTX 4070多出2个。它采用了192位宽的内存总线和12GB显存容量，对于这个级别的产品来说似乎有些不足。其加速频率略高于RTX 4070，从2.48 GHz提升到2.51 GHz，总功耗为250W。
在这里插入图片描述
所有新的GeForce 50系列显卡都配备了更新的连接功能，如宣布的型号支持PCIe 5.0 x16接口，以及支持主动线缆的DisplayPort 2.1b UHBR20。此外，它们还支持HDMI 2.1，并且每个型号都配备了一个16针电源接口。

GPU性能和价格

接下来，让我们深入探讨一下Blackwell架构最重要的方面。这里既有好消息也有坏消息。GeForce RTX 5090的价格果然高得离谱，达到了2000美元。与此同时，拥有GPU一半硬件的RTX 5080定价为1000美元，虽然也比较贵，但比许多传闻中的价格要温和一些。

让我们感到惊讶的是RTX 5070 Ti定价750美元，RTX 5070定价550美元，这两款显卡在上市时的价格都比上一代同类产品低了50美元。
在这里插入图片描述
至于性能方面，英伟达一如既往地利用其营销策略来掩盖实际的游戏性能。RTX 50系列显卡支持DLSS 4多帧生成技术，这是上一代显卡所不具备的。这意味着在支持DLSS的游戏中，RTX 50系列显卡可以生成比上一代显卡多一倍的帧数，使其在表面上看起来比RTX 40系列显卡“快”一倍。但实际上，虽然DLSS 4会使帧率提升，但延迟和游戏手感可能不会得到如此显著的改善。

在图表中，英伟达突出了四款支持DLSS 4的游戏和应用：《赛博朋克2077》、《心灵杀手2》、《黑神话：悟空》和D5 Render。然而，由于我们缺乏这些游戏的实际性能数据，因此暂且将其搁置一旁。其他游戏的性能表现更为重要。
在这里插入图片描述
RTX 5070性能匹敌RTX 4090的说法似乎令人怀疑。也许在DLSS 4的加持下，它能在帧率上与RTX 4090匹敌，但在非DLSS的原生性能上肯定无法做到。根据英伟达的图表，RTX 5070在1440p分辨率下似乎比RTX 4070快20%到30%。

这意味着RTX 5070的性能会略高于RTX 4070 Super，但价格却低了约50美元；或者与RTX 4070价格相同，但性能却高出20%到30%。RTX 5070相对于RTX 4070 Super的性能表现，可能会提供合理的性价比，尽管略显不足。如果RTX 5070的性能比4070 Super提高10%，而价格降低9%，那么每帧成本将大约改善20%。
在这里插入图片描述
英伟达对RTX 5070 Ti也做出了类似的宣称，估计其在1440p分辨率下的性能比4070 Ti高出20%到30%（忽略具有误导性的DLSS 4数据）。与RTX 4070 Ti相比，这将带来更好的每帧成本改善，可能超过30%，尽管与4070 Ti Super相比，这一改善将缩小至接近20%。

RTX 5080的情况也类似：其性能比RTX 4080高出20%到30%。考虑到RTX 4080 Super仅比RTX 4080快约5%，因此RTX 5080的每帧成本效率大约提高了20%。
在这里插入图片描述
至于RTX 5090，非DLSS 4的数据显示其性能比RTX 4090高出20%到40%。然而，由于RTX 5090的定价比RTX 4090高出25%，因此大多数游戏需要实现接近50%的性能提升，才能使每帧成本改善20%。

英伟达的测试是在4K分辨率下使用DLSS性能模式进行的，这基本上是以1080p的分辨率进行渲染。这可能会导致CPU瓶颈，并使RTX 5090的强大性能无法得到充分利用。我们怀疑这可能是导致在采用光线追踪的DLSS 4游戏中相比传统游戏的性能提升更为显著的原因。当然，我们还得等待评测结果出来才能见分晓。

我们初步感觉是，与RTX 40 Super系列显卡相比，英伟达似乎全面提供了大约20%的每帧成本改善，因此性价比也提高了20%。这肯定比RTX 40系列要好得多，因为在很多情况下，RTX 40系列对于玩家来说在性价比方面毫无提升。希望这个明显的20%性价比提升在实际中能达到30%，如果是这样的话，这将是不错的一代产品。

差距越来越大，加上其他架构改进

对于这一代显卡，我们颇为担忧的一点是，英伟达（Nvidia）在最高端型号与紧随其后的型号之间制造了巨大的鸿沟。RTX 5090 的硬件配置基本上是 RTX 5080 的两倍，这着实荒谬。这仿佛让我们回到了双GPU的时代，只不过这一次是巨大的单片GPU芯片。相比之下，RTX 5080 显得颇为逊色，尽管两者之间存在相当大的价格差异来解释这一点。

80系列显卡与顶级显卡之间性能差距微小的日子已经一去不复返了。这一差距正在不断扩大，这意味着若想获得比40系列顶级显卡更出色的性能，就不得不支付更多的费用。
在这里插入图片描述
这会对其他产品系列产生连带影响，使得它们与顶级显卡相比也显得较为逊色。不过，至少有个好消息：上一代RTX 4080的CUDA核心数量比RTX 4070 Ti多26%，而这一代RTX 5080的CUDA核心数量则比RTX 5070 Ti多20%，且两者的内存规格也更加接近。因此，与英伟达在RTX 40系列发布时所做相比，RTX 5070 Ti相对于RTX 5080的阉割程度没有那么严重。

英伟达的Blackwell架构是对之前架构的迭代，改进了之前存在的各个方面，如光线追踪单元和张量核心。Jensen花了大量时间来专门介绍人工智能——我们就不赘述了——但简而言之，Blackwell架构除了常规处理外，在人工智能方面也很强大。这很让人震惊，对吧？新一代英伟达显卡又被宣传为最适合人工智能的显卡。

该架构与张量核心在流式多处理器（Streaming Multiprocessor，简称SM）内的集成更加紧密，着色器执行重新排序的效率提高了一倍，光线追踪核心的光线-三角形相交速率提高了一倍，并增强了压缩功能以减少内存占用。英伟达声称，这将使得在光线追踪时能够呈现更多的几何图形。
在这里插入图片描述
Blackwell架构还改进了视频编码和解码功能，配备了新一代硬件引擎。自RTX 20系列升级到30系列以来，我们首次看到视频解码引擎的改进。新的显示引擎还支持新的多显示器配置：无需显示流压缩（Display Stream Compression，简称DSC）即可连接最多四个4K 165Hz显示器，或使用DSC连接两个4K 360Hz显示器。使用DSC连接两个8K 100Hz显示器也成为可能。

英伟达为除RTX 5070 Ti之外的所有型号都推出了Founders Edition版本。这一版本的外观与RTX 4090 Founders Edition显卡相似，只不过现在两个风扇都在同一侧。令人惊讶的是，尽管RTX 5090的功耗高达575W，但英伟达仍为其采用了双槽设计。RTX 5080似乎采用了非常相似的Founders Edition设计，而RTX 5070则采用了长度较短的简化版设计，根据英伟达提供的数据，其长度为242毫米，而非304毫米。

DLSS 4下一代升级技术

英伟达还宣布了DLSS 4，这是其超采样技术的下一代产品。其主打功能是帧生成，即每1帧真实画面生成3帧，而非之前的每1帧真实画面生成1帧。
关于延迟和图像质量，这里存在很大的疑问。当每两帧生成一帧时，有50%的时间是真实画面；而当生成3帧时，只有25%的时间是真实画面。因此，这些生成的帧必须具备极高的质量；否则，你经常会看到大量的伪影——除非生成的帧质量相对于DLSS 3有显著提升，否则这将是一个问题。

另一个问题是使用多帧渲染来“破解”高帧率游戏。英伟达展示了一个演示，在没有DLSS 4的情况下，游戏以30帧每秒（FPS）运行，但启用DLSS 4后，帧率超过了240 FPS。当然，在30 FPS的示例中，甚至没有启用DLSS超采样，但我们真的不希望看到任何通过生成3帧来将30 FPS的游戏提升到120 FPS的情况——在输入延迟方面，这将绝对是可怕的。
在这里插入图片描述
DLSS 4仅适用于Blackwell GPU，但仅限于多帧渲染组件。DLSS 4还对常规帧生成、超分辨率和光线重建进行了增强，对这些功能的支持与目前相同。

对多帧渲染的限制是由于英伟达在Blackwell架构中所谓的“增强的硬件翻转计量能力”。英伟达表示，这是为了获得流畅的体验，我们希望这是真的；否则，RTX 40系列用户就被坑了。

据英伟达称，DLSS 4在超采样和其他方面的质量提升非常显著，这得益于使用了转换器。英伟达声称，这将“通过提高时间稳定性、减少重影以及提高运动中的细节来改善图像质量。”这听起来很令人兴奋，而且说实话，我们对DLSS 4中超采样质量提升的兴趣比对多帧渲染的兴趣更大。英伟达还表示，新的帧生成模型速度提高了40%，并且视频内存（VRAM）使用量减少了30%。对于生成多帧，人工智能算法每渲染一帧只需运行一次。光学流被高效的硬件模型所取代，这引发了疑问：既然之前由于Ada Lovelace中的光学流加速器而受到硬件限制，那么帧生成为何仍然仅适用于40系列？

目前尚不清楚的是，DLSS的新转换器模型是否会对性能产生影响，以及这种性能影响是否对所有GPU都相同。例如，他们声称帧生成现在更快了，但这是否适用于RTX 50和RTX 40 GPU？使用转换器模型进行超采样是否会对性能产生影响？这些问题需要在测试中回答。

Nvidia的游戏软件护城河

DLSS 4发布时，将有75款游戏和应用支持，显示英伟达重视广泛游戏支持以确保新功能价值。虽然不确定是否所有游戏都会因此重大更新，或英伟达有无自动添加DLSS 4的方法，但列表显示其正积极推广。

英伟达还在应用中构建覆盖功能，可升级DLSS模型，对50系列显卡用户还有额外帧生成转换。同时，英伟达宣布Reflex 2，将VR游戏的帧扭曲技术引入PC游戏，旨在减少感知延迟，但实际效果待观察，且图像质量可能受影响。Reflex 2将先支持RTX 50系列显卡，后扩展至其他。

此外，Blackwell支持RTX神经着色器和面部技术，但具体在游戏中何时应用尚不确定，目前更像未来功能。神经着色器可压缩纹理节省内存，或解释新一代显卡VRAM吝啬，但对不支持此功能游戏无用。
在这里插入图片描述
以上就是英伟达在2025年国际消费电子展（CES 2025）上有关RTX 50 Blackwell GPUs的所有内容。乍一看，新的GeForce RTX 50系列显卡阵容还算合理，但并没有让我们惊叹不已。剔除掉所有关于新功能夸大其词的营销宣传后，性能提升看起来还算合理，价值提升看起来也还算不错，硬件本身也很令人印象深刻。

但RTX 5070是个例外，这款显卡只有12GB VRAM，售价却高达550美元——对于2025年这一级别的显卡来说，这个容量太低了，尽管英伟达声称通过新功能减少了内存使用。即使没有应用DLSS，一些游戏已经显示出12GB内存不够用，而且由于大部分VRAM节省都是通过DLSS 4模型更新来实现的，如果基础游戏在12GB VRAM下仍然无法运行，那么帧生成内存效率稍高一点也就无关紧要了。

定价没有离谱或高得惊人，这总是一件好事，这看起来不会重演RTX 40系列的情况。当然，我们仍然需要看到这些型号带来显著的性能提升，才能获得所需的价值提升。

有关DLSS 4的参数信息听起来不错，我们很期待看到关于提升超采样质量的声明。对于多帧生成功能，我们目前还持保留意见，考虑到它对图像质量和延迟可能产生的影响……尤其是如果它被用作支撑以降低原生渲染帧率的手段。
在这里插入图片描述
这仅仅是一次产品预告，并非立即有硬件上市，因此目前还没有解除评测或基准测试禁令。英伟达CEO黄仁勋在CES主题演讲中透露，Blackwell GPU正在“全力生产”，首批GeForce RTX 50系列显卡将于1月末推出。随着硬件上市，我们将及时为大家分享更多有关NVIDIA GeForce RTX 50系列显卡的性能基准测试。