许多计算平台提供专用硬件来执行一系列与视频相关的任务。使用这样的硬件可以让解码、编码或后处理效果等操作更快地完成,减少CPU的占用率。在PC上,视频硬件通常集成到GPU(比如AMD,Intel HD Graphics,NVIDIA或者VideoCore),而在移动soc类型的平台上,它通常是一个独立的IP核心,被称为VE,或者VPU(video process unit)的Master设备。
图像编解码用到的核心算法是DCT/IDCT,它将时域信号转换到频域,得到频域的DCT系数,然后再对系数进行一次过滤,选择,忽略掉高频系数,然后再变换回时域,得到压缩后的时域图像。所以VPU本质就是将DCT/IDCT算法硬件化,然后再加上去方块滤波,熵编码等等一些列的辅助算法模块。
硬件解码器将产生与软件解码器相同的输出,但却大大提高了解码效率。而硬件编码器产生的输出质量通常比好的软件编码器(如x264)低得多,但通常速度更快,而且不占用太多CPU资源。(也就是说,它们需要更高的比特率才能以相同的感知质量进行输出,或者在相同的比特率下以较低的感知质量进行输出).
VPU的实现有很多,每个厂家IP的控制界面,控制寄存器的设计完全不同,给有效利用和推广自家IP的设计带来了很多麻烦,有鉴于此,很多原厂主动推出了一些标准的API用于标准化自家VPU的开发,也有些vendor厂商主动联合起来,指定一套标准构成一个标准联盟,这种事情多了,就出现了很多套标准同时存在的情况,如下表所示: