显卡最早只不过是PC中的一个负责显示输出的零部件,最初显卡的作用就是把图形处理能力从CPU里独立出来。然而随着通用计算理念的诞生,GPU可以做越来越多的运算,俨然已经成为PC中的最核心部件。越来越多的应用可以通过GPU来处理和加速,GPU强大的并行处理能力在许多应用场景都表现出比CPU更为强劲的性能。CPU更多像是系统的调度师,而GPU则是真正的得力干将。特别是各种视频创作类软件,已经越来越依赖于GPU的加速。
NVIDIA Video CODEC编码加速单元
NVIDIA向来都很注重视频工作者的需求,他们最初推出CUDA通用计算时,当中的一个重要功能就是用GPU加速视频压缩,随后一直发展添加各种不同的功能来提升显卡的生产力,自6系列的开普勒架构显卡上NVIDIA已经在GPU内加入了NVIDIA Video CODEC编码加速单元(简称NVENC和NVDEC),用来取代此前的CUDA加速方案,而且转码速度比CUDA更快,并且可以降低此负载下的显卡能耗,到了现在的RTX 20系列显卡,NVENC已经发展到了第六代,功能与性能都较此前的有了很大提升。
NVENC是利用NVIDIA GeForce显卡中专门的处理单元进行运算的
图灵架构的NVENC编码器效率提升很明显
现在NVIDIA更是为创作者们推出专用的创意应用优化的Studio驱动,在Adobe Premiere Pro、DaVinci Resolve这类视频剪辑工作,支持在无代理下面,提供流畅的高分辨率时间线回放,还有效果加速和AI重构图等功能。
视频制作时目前创作者市场中最大的应用需求之一,在RTX系列显卡的加速下,8K RAW的处理已经不在话下。当然更多的主流视频制作工作者其实大多数工作项目都还不会上到如此高的分辨率,而目前4K分辨率仍然是最流行的视频尺寸。
Bilibili作为目前国内最大的原创视频平台之一,在今年五月开放了最高4K/120fps的视频格式上传,可以用更高清的画面来呈现创作者的故事,而网络传媒巨头今日头条旗下的西瓜视频,也已经跟进了4K视频的上传,所以随着平台支持了更高分辨率视频,这对于国内视频创作者,由于4K视频后期处理压力的大幅提高,他们在用于剪辑工作的硬件设备上自然有了升级需要。
NVENC加入到Premiere Pro工作流
在Premiere Pro的视频制作工作流当中,主要分为了原始素材导入、剪辑与添加效果,以及最后的成片导出三个主要阶段,对于硬件来说,在第一阶段的素材导入时,目前主要是利用CPU来进行解码(decode)工作的,而到了第二阶段的视频剪辑过程,处理这些操作的仍然主要是CPU,但如今的视频制作不仅仅是对素材进行简单的修剪、拼接,还会有各种转场、字幕、调色、颗粒化等等进阶效果,如果这些全靠CPU来回放预览,处理起来会非常卡顿和缓慢,所以在过去有不少视频工作者,会对原始素材进行生成代理文件,以降低对CPU资源的占用。
为此Adobe与NVIDIA一起合作,在PR中加入了支持利用GPU来处理回放、效果、多轨道预览等操作,以提升处理效率。这便是Mercury Playback Engine,它可以利用GPU来显著加速视频剪辑阶段的工作效率。
在目前最新版本的Premiere Pro里面,NVIDIA GPU已经支持非常多的效果加速,包括大家常用的变形稳定器、模糊、裁剪,以及Lumetri调色等等,这些在过去都是需要CPU,耗费大量时间去做分析和运算,但现在有了GPU的帮助,可以更快完成这些效果的合成速度,让剪辑工作变得更顺畅。
最后当大家把素材剪好、加完效果后,就要到第三阶段的导出视频了,而这次Preimere Pro的大升级,便是针对这一部分引入了额外的硬件加速,因为过去这个环节,其实也是更多采用CPU来进行编码(encode),由此可见现阶段CPU性能提升已经不足以满足视频处理的需要了。而GPU则将很多工作一点一点的接了过来,在整个工作流中扮演着越来越重要的角色。
如果使用CPU进行编码,速度是很慢的。这对于视频工作者来说一直是老大难的问题,因为他们可能要等待数个小时,才能看到自己的视频成片。如果成片需要再次修改,将会重复这个过程,枯燥的等待让人烦恼,同时也大幅降低了工作效率,相信每个视频后期工作者都对此深有同感。
所以Adobe在最新版的Premiere Pro里面,让NVIDIA GPU参与到视频导出工作当中,这用到RTX 20系列GPU内置的NVENC,由于是专物专用的硬件编码器,有更高效率的视频处理能力,所以NVIDIA官方表示,NVENC的加入可以为视频导出带来高达五倍的速度提升。
测试平台与说明
本次测试我们使用了NVIDIA RTX 2060 Founders Edition与GTX 1060 Founders Edition两张显卡,要看看两代核心之间NVENC的效能差距有多大,同时还会测试CPU与显卡之间编码效率到底有多大差距,驱动为NVIDIA最新版Studio驱动451.77。
测试平台处理器选用Intel最新的Core i9-10900K,因为还想看看Intel的核显会有啥影响,主板是华硕ROG STRIX Z490-A GAMING,内存直接上了双通道32GB,因为我们之前测试过Premiere Pro里面16GB和32GB内存是有明显性能差距的,用的是芝奇皇家戟DDR4-3600 CL16 16GB*2套装。
要想在Premiere Pro里面用到NVENC,就要使用Premiere Pro 2020 14.2或更新的版本,测试内容包括三个视频的导出,分为Big Buck Bunny 4K,这是个高码率的H.264视频文件;Music Video 4K,这用到多个视频素材混合,并加有多种效果的项目;Paintball 4K,这是用到RAW格式素材,加上多种效果的项目。它们是专门用来跑测试的视频project,有比较刻意用到很多个机位、多图层和夸张的效果,所以这些项目其实相比主流的4K项目,对硬件的要求压力更大。
4K视频导出测试
首先我们先来看看RTX 2060显卡在开启与关闭NVENC时会对Premiere Pro导出带来多大的影响,测试的三个视频都会导出成高质量的2160p H.264视频。
其实关闭NVENC之后,显卡依然会在视频导出时起到一定的作用,毕竟CUDA还在,但效能与与开启NVENC差远了,不同的视频项目之间也有一定的差距,最高的开启与关闭NVENC之间的耗时差了4倍多,最少的也有1.8倍,可见NVENC能大幅的节约视频制作者的导出时间,提升生产力。
接下来我们看看图灵与上一代的帕斯卡显卡的NVENC效能有多少提升,同时还对比下NVIDIA显卡加速与纯CPU软件编码,以及CPU+QuickSync有多大差距。
RTX 2060较GTX 1060视频导出的效率最多有44%的提升,这是新一代的NVENC与显卡核心架构提升共同作用下带来的结果。纯CPU软件编码的话就慢了,我们用的已经是Intel最新的10核处理器Core i9-10900K了,它软件编码的耗时是RTX 2060的4到11倍,即使开了UHD 630的QuickSync加持,差距依然有2到10倍,在没有NVIDIA显卡的助力下,CPU以及CPU加核显的处理视频都极度花费时间,只需要加一张NVIDIA显卡就能极大地缩短了处理所需要的时间,NVENC的作用是非常大的,你甚至能节省一笔钱不用买那么高端的处理器,因为在显卡的助力下,Core i9-10900K甚至没有满负载。
RTX显卡可大幅提升4K生产效率
现在的显卡已经不是单纯的图形渲染卡这么简单,它不单只能玩游戏,还能干许多东西,是一种生产力工具,这里展示的视频编码加速只是其中一种。
新版的Premiere Pro已经加入了对NVENC的支持,在NVIDIA显卡的助力下视频导出效率大幅提升,比纯CPU软件运算最多有10倍的提速,在4K分辨率下差距更加明显,这可以帮视频内容创作者大大节省时间成本,从而在整个工作流当中,能有效提高工作的效率,让创作过程更加灵活。
同时NVENC加入到Premiere Pro工作流之后可以降低CPU的负载,如果再配合CPU内的核显一齐使用的话,不论视频剪辑还是导出的时候,CPU核心的负载是非常低的,也就是说,你可以降低对CPU的投入,不用花高价买10核的Core i9,甚至核心数量更多的HEDT平台,用个6核12线程的Core i5就能非常流畅的剪辑4K视频,在省钱的同时还提高了生产效率,一块NVIDIA RTX显卡绝对是内容创作者的得力助手。