ROI (region of interest) encoding是一项基于感兴趣区域的视频编码技术,对图像中感兴趣的区域减少量化参数值(qp:quantization parameter),从而分配更多码率以提升画面质量,而对不感兴趣的区域则增加量化参数值(qp),从而分配更少码率(这部分区域的画面质量会因此有所下降),这样,在不损失图像整体质量的前提下,可以节省网络带宽占用和视频存储空间,或者,在不增加网络带宽占用和存储空间的前提下,可以提高视频的整体质量。这在监控、窄带高清等领域都有较大的应用。
ROI encoding并不是一个新技术,诸如libx264、libvpx等软件编码器早已经提供了相应的支持,基于Intel GPU的libva也早已实现了相应接口。但是,每个编码器提供的接口都不一样,这给开发者带来了一定的麻烦。所以,建立在这些编码器之上的FFmpeg,完全可以定义一个统一的接口,然后,在FFmpeg的内部,将这个统一接口的参数翻译为相应编码器的API调用。我在2019年为FFmpeg增加了这样的接口,以支持ROI encoding,如下图所示。
此接口的关键数据结构是:
typedef struct AVRegionOfInterest {