英伟达终于发布了全新的GeForce 50系列显卡,以及DLSS 4技术。此次共推出了四款高端GPU,不久后大家就能亲身体验到这些新品了。RTX 5080和RTX 5090将于1月30日率先上市,而RTX 5070和RTX 5070 Ti则会在2月面世。现在,是时候分享我们在2025年国际消费类电子产品展览会(CES)主题演讲中所获知的各项信息了,包括所有规格、价格以及性能表现。
新GPU
全新的RTX 5090旗舰显卡相较于上一代产品,硬件性能大幅提升。它不仅采用了英伟达最新的Blackwell架构,还拥有更多的CUDA核心、更高的内存带宽以及更大的显存容量。SM(流多处理器)数量从RTX 4090的128个增加到RTX 5090的170个,核心规模提升了33%。不过,GPU加速频率略有下降,从2.5 GHz降至2.4 GHz。
内存子系统经过全面优化,现在配备了512位宽的GDDR7技术。GDDR7内存时钟频率为28 Gbps,使得内存带宽高达1,792 GB/s,较RTX 4090的带宽提升了近80%。此外,该显卡还配备了32GB显存,这是英伟达在消费级显卡上提供的最大显存容量。
由于Blackwell仍然采用台积电4nm工艺制造,因此为容纳这些核心和内存,其板卡功耗已提升至惊人的575W,比RTX 4090高出28%。
RTX 5080则采用了较小的GPU配置,基于完全不同的GPU芯片,仅有84个SM,比上一代RTX 4080 Super多出4个。
该型号几乎所有方面的配置都是RTX 5090的一半:CUDA核心数量接近一半,内存位宽减半至256位,显存容量减半至16GB,通过30 Gbps的GDDR7内存实现略高于一半的内存带宽,即960 GB/s。从历史配置来看,这一规格更接近于RTX 5070级别的显卡,因此将其定位为5080对玩家来说有些失望。
RTX 5070 Ti进一步缩减,配备了70个SM,比上一代RTX 4070 Ti Super多出4个。不过,加速频率从2.61 GHz降至2.45 GHz。其内存位宽与RTX 5080保持一致,同为256位,因此也配备了16GB的GDDR7内存。此次,内存时钟频率为28 Gbps,带宽为896 GB/s。RTX 5070 Ti的功耗为300W,而RTX 5080的功耗为360W。
至于RTX 5070,它配备了48个SM,仅比上一代RTX 4070多出2个。它采用了192位宽的内存总线和12GB显存容量,对于这个级别的产品来说似乎有些不足。其加速频率略高于RTX 4070,从2.48 GHz提升到2.51 GHz,总功耗为250W。
所有新的GeForce 50系列显卡都配备了更新的连接功能,如宣布的型号支持PCIe 5.0 x16接口,以及支持主动线缆的DisplayPort 2.1b UHBR20。此外,它们还支持HDMI 2.1,并且每个型号都配备了一个16针电源接口。
GPU性能和价格
接下来,让我们深入探讨一下Blackwell架构最重要的方面。这里既有好消息也有坏消息。GeForce RTX 5090的价格果然高得离谱,达到了2000美元。与此同时,拥有GPU一半硬件的RTX 5080定价为1000美元,虽然也比较贵,但比许多传闻中的价格要温和一些。
让我们感到惊讶的是RTX 5070 Ti定价750美元,RTX 5070定价550美元,这两款显卡在上市时的价格都比上一代同类产品低了50美元。
至于性能方面,英伟达一如既往地利用其营销策略来掩盖实际的游戏性能。RTX 50系列显卡支持DLSS 4多帧生成技术,这是上一代显卡所不具备的。这意味着在支持DLSS的游戏中,RTX 50系列显卡可以生成比上一代显卡多一倍的帧数,使其在表面上看起来比RTX 40系列显卡“快”一倍。但实际上,虽然DLSS 4会使帧率提升,但延迟和游戏手感可能不会得到如此显著的改善。
在图表中,英伟达突出了四款支持DLSS 4的游戏和应用:《赛博朋克2077》、《心灵杀手2》、《黑神话:悟空》和D5 Render。然而,由于我们缺乏这些游戏的实际性能数据,因此暂且将其搁置一旁。其他游戏的性能表现更为重要。
RTX 5070性能匹敌RTX 4090的说法似乎令人怀疑。也许在DLSS 4的加持下,它能在帧率上与RTX 4090匹敌,但在非DLSS的原生性能上肯定无法做到。根据英伟达的图表,RTX 5070在1440p分辨率下似乎比RTX 4070快20%到30%。
这意味着RTX 5070的性能会略高于RTX 4070 Super,但价格却低了约50美元;或者与RTX 4070价格相同,但性能却高出20%到30%。RTX 5070相对于RTX 4070 Super的性能表现,可能会提供合理的性价比,尽管略显不足。如果RTX 5070的性能比4070 Super提高10%,而价格降低9%,那么每帧成本将大约改善20%。
英伟达对RTX 5070 Ti也做出了类似的宣称,估计其在1440p分辨率下的性能比4070 Ti高出20%到30%(忽略具有误导性的DLSS 4数据)。与RTX 4070 Ti相比,这将带来更好的每帧成本改善,可能超过30%,尽管与4070 Ti Super相比,这一改善将缩小至接近20%。
RTX 5080的情况也类似:其性能比RTX 4080高出20%到30%。考虑到RTX 4080 Super仅比RTX 4080快约5%,因此RTX 5080的每帧成本效率大约提高了20%。
至于RTX 5090,非DLSS 4的数据显示其性能比RTX 4090高出20%到40%。然而,由于RTX 5090的定价比RTX 4090高出25%,因此大多数游戏需要实现接近50%的性能提升,才能使每帧成本改善20%。
英伟达的测试是在4K分辨率下使用DLSS性能模式进行的,这基本上是以1080p的分辨率进行渲染。这可能会导致CPU瓶颈,并使RTX 5090的强大性能无法得到充分利用。我们怀疑这可能是导致在采用光线追踪的DLSS 4游戏中相比传统游戏的性能提升更为显著的原因。当然,我们还得等待评测结果出来才能见分晓。
我们初步感觉是,与RTX 40 Super系列显卡相比,英伟达似乎全面提供了大约20%的每帧成本改善,因此性价比也提高了20%。这肯定比RTX 40系列要好得多,因为在很多情况下,RTX 40系列对于玩家来说在性价比方面毫无提升。希望这个明显的20%性价比提升在实际中能达到30%,如果是这样的话,这将是不错的一代产品。
差距越来越大,加上其他架构改进
对于这一代显卡,我们颇为担忧的一点是,英伟达(Nvidia)在最高端型号与紧随其后的型号之间制造了巨大的鸿沟。RTX 5090 的硬件配置基本上是 RTX 5080 的两倍,这着实荒谬。这仿佛让我们回到了双GPU的时代,只不过这一次是巨大的单片GPU芯片。相比之下,RTX 5080 显得颇为逊色,尽管两者之间存在相当大的价格差异来解释这一点。
80系列显卡与顶级显卡之间性能差距微小的日子已经一去不复返了。这一差距正在不断扩大,这意味着若想获得比40系列顶级显卡更出色的性能,就不得不支付更多的费用。
这会对其他产品系列产生连带影响,使得它们与顶级显卡相比也显得较为逊色。不过,至少有个好消息:上一代RTX 4080的CUDA核心数量比RTX 4070 Ti多26%,而这一代RTX 5080的CUDA核心数量则比RTX 5070 Ti多20%,且两者的内存规格也更加接近。因此,与英伟达在RTX 40系列发布时所做相比,RTX 5070 Ti相对于RTX 5080的阉割程度没有那么严重。
英伟达的Blackwell架构是对之前架构的迭代,改进了之前存在的各个方面,如光线追踪单元和张量核心。Jensen花了大量时间来专门介绍人工智能——我们就不赘述了——但简而言之,Blackwell架构除了常规处理外,在人工智能方面也很强大。这很让人震惊,对吧?新一代英伟达显卡又被宣传为最适合人工智能的显卡。
该架构与张量核心在流式多处理器(Streaming Multiprocessor,简称SM)内的集成更加紧密,着色器执行重新排序的效率提高了一倍,光线追踪核心的光线-三角形相交速率提高了一倍,并增强了压缩功能以减少内存占用。英伟达声称,这将使得在光线追踪时能够呈现更多的几何图形。
Blackwell架构还改进了视频编码和解码功能,配备了新一代硬件引擎。自RTX 20系列升级到30系列以来,我们首次看到视频解码引擎的改进。新的显示引擎还支持新的多显示器配置:无需显示流压缩(Display Stream Compression,简称DSC)即可连接最多四个4K 165Hz显示器,或使用DSC连接两个4K 360Hz显示器。使用DSC连接两个8K 100Hz显示器也成为可能。
英伟达为除RTX 5070 Ti之外的所有型号都推出了Founders Edition版本。这一版本的外观与RTX 4090 Founders Edition显卡相似,只不过现在两个风扇都在同一侧。令人惊讶的是,尽管RTX 5090的功耗高达575W,但英伟达仍为其采用了双槽设计。RTX 5080似乎采用了非常相似的Founders Edition设计,而RTX 5070则采用了长度较短的简化版设计,根据英伟达提供的数据,其长度为242毫米,而非304毫米。
DLSS 4下一代升级技术
英伟达还宣布了DLSS 4,这是其超采样技术的下一代产品。其主打功能是帧生成,即每1帧真实画面生成3帧,而非之前的每1帧真实画面生成1帧。
关于延迟和图像质量,这里存在很大的疑问。当每两帧生成一帧时,有50%的时间是真实画面;而当生成3帧时,只有25%的时间是真实画面。因此,这些生成的帧必须具备极高的质量;否则,你经常会看到大量的伪影——除非生成的帧质量相对于DLSS 3有显著提升,否则这将是一个问题。
另一个问题是使用多帧渲染来“破解”高帧率游戏。英伟达展示了一个演示,在没有DLSS 4的情况下,游戏以30帧每秒(FPS)运行,但启用DLSS 4后,帧率超过了240 FPS。当然,在30 FPS的示例中,甚至没有启用DLSS超采样,但我们真的不希望看到任何通过生成3帧来将30 FPS的游戏提升到120 FPS的情况——在输入延迟方面,这将绝对是可怕的。
DLSS 4仅适用于Blackwell GPU,但仅限于多帧渲染组件。DLSS 4还对常规帧生成、超分辨率和光线重建进行了增强,对这些功能的支持与目前相同。
对多帧渲染的限制是由于英伟达在Blackwell架构中所谓的“增强的硬件翻转计量能力”。英伟达表示,这是为了获得流畅的体验,我们希望这是真的;否则,RTX 40系列用户就被坑了。
据英伟达称,DLSS 4在超采样和其他方面的质量提升非常显著,这得益于使用了转换器。英伟达声称,这将“通过提高时间稳定性、减少重影以及提高运动中的细节来改善图像质量。”这听起来很令人兴奋,而且说实话,我们对DLSS 4中超采样质量提升的兴趣比对多帧渲染的兴趣更大。英伟达还表示,新的帧生成模型速度提高了40%,并且视频内存(VRAM)使用量减少了30%。对于生成多帧,人工智能算法每渲染一帧只需运行一次。光学流被高效的硬件模型所取代,这引发了疑问:既然之前由于Ada Lovelace中的光学流加速器而受到硬件限制,那么帧生成为何仍然仅适用于40系列?
目前尚不清楚的是,DLSS的新转换器模型是否会对性能产生影响,以及这种性能影响是否对所有GPU都相同。例如,他们声称帧生成现在更快了,但这是否适用于RTX 50和RTX 40 GPU?使用转换器模型进行超采样是否会对性能产生影响?这些问题需要在测试中回答。
Nvidia的游戏软件护城河
DLSS 4发布时,将有75款游戏和应用支持,显示英伟达重视广泛游戏支持以确保新功能价值。虽然不确定是否所有游戏都会因此重大更新,或英伟达有无自动添加DLSS 4的方法,但列表显示其正积极推广。
英伟达还在应用中构建覆盖功能,可升级DLSS模型,对50系列显卡用户还有额外帧生成转换。同时,英伟达宣布Reflex 2,将VR游戏的帧扭曲技术引入PC游戏,旨在减少感知延迟,但实际效果待观察,且图像质量可能受影响。Reflex 2将先支持RTX 50系列显卡,后扩展至其他。
此外,Blackwell支持RTX神经着色器和面部技术,但具体在游戏中何时应用尚不确定,目前更像未来功能。神经着色器可压缩纹理节省内存,或解释新一代显卡VRAM吝啬,但对不支持此功能游戏无用。
以上就是英伟达在2025年国际消费电子展(CES 2025)上有关RTX 50 Blackwell GPUs的所有内容。乍一看,新的GeForce RTX 50系列显卡阵容还算合理,但并没有让我们惊叹不已。剔除掉所有关于新功能夸大其词的营销宣传后,性能提升看起来还算合理,价值提升看起来也还算不错,硬件本身也很令人印象深刻。
但RTX 5070是个例外,这款显卡只有12GB VRAM,售价却高达550美元——对于2025年这一级别的显卡来说,这个容量太低了,尽管英伟达声称通过新功能减少了内存使用。即使没有应用DLSS,一些游戏已经显示出12GB内存不够用,而且由于大部分VRAM节省都是通过DLSS 4模型更新来实现的,如果基础游戏在12GB VRAM下仍然无法运行,那么帧生成内存效率稍高一点也就无关紧要了。
定价没有离谱或高得惊人,这总是一件好事,这看起来不会重演RTX 40系列的情况。当然,我们仍然需要看到这些型号带来显著的性能提升,才能获得所需的价值提升。
有关DLSS 4的参数信息听起来不错,我们很期待看到关于提升超采样质量的声明。对于多帧生成功能,我们目前还持保留意见,考虑到它对图像质量和延迟可能产生的影响……尤其是如果它被用作支撑以降低原生渲染帧率的手段。
这仅仅是一次产品预告,并非立即有硬件上市,因此目前还没有解除评测或基准测试禁令。英伟达CEO黄仁勋在CES主题演讲中透露,Blackwell GPU正在“全力生产”,首批GeForce RTX 50系列显卡将于1月末推出。随着硬件上市,我们将及时为大家分享更多有关NVIDIA GeForce RTX 50系列显卡的性能基准测试。
若您在服务器技术方面有任何疑问,或渴望深入了解更多专业信息,我们非常欢迎您的私信交流,期待能为您提供有价值的见解与支持。