NALU(Network Abstract Layer Unit):两标准中的比特流都是以NAL为单位,每个NAL单元包含一个RBSP,NALU的头信息定义了RBSP所属类型。类型一般包括序列参数集(SPS)、图像参数集(PPS)、增强信息(SEI)、条带(Slice)等,其中,SPS和PPS属于参数集,两标准采用参数集机制是为了将一些重要的序列、图像参数(解码图像尺寸、片组数、参考帧数、量化和滤波参数标记等)与其他参数分离,通过解码器先解码出来。此外,为了增强图像的清晰度,AVS-M增加了图像头(Picture head)信息。读取NALU过程中,每个NALU前有一个起始码0x000001,为防止内部0x000001序列竞争,H.264编码器在最后一字节前插入一个新的字节——0x03,所以解码器检测到该序列时,需将0x03删掉,而AVS-M只需识别出起始码0x000001。
读取宏块类型(mb type)和宏块编码模板(cbp):编解码图像以宏块划分,一个宏块由一个16*16亮度块和相应的一个8*8cb和一个8*8cr色度块组成。
(a) 两标准的帧内、帧间预测时宏块的划分是有区别的。H.264中,I_slice亮度块有Intra_4*4和Intra_16*16两种模式,色度块只有8*8模式;P_slice宏块分为16*16、16*8、8*16、8*8、8*4、4*8、4*4共7种模式。而AVS-M中,I_slice亮度块有I_4*4和I_Direct两模式,P_slice时宏块的划分和H.264中的划分一致。
(b) 两标准的宏块cbp值计算也不相同。H.264中,Intra_16*16宏块的亮度(色度)cbp直接通过读mb type得到;非Intra_16*16宏块的亮度cbp=coded_block_pattern%16,色度cbp=coded_block_pattern/16 。其中,亮度cbp最低4位有效,每位决定对应宏块的残差系数是否为0;色度cbp为0时,对应残差系数为0,cbp为1时,DC残差系数不为0,AC系数为0,cbp为2时,DC、AC残差系数都不为0。AVS-M中,当宏块类型不是P_skip时,直接从码流中得到cbp的索引值,并以此索引值查表得到codenum值,再以codenum查表分别得到帧内/帧间cbp。此cbp为6位,每位代表宏块按8*8划分时是否包含非零系数,当变换系数不为0时,需进一步读cbp_4*4中每位值来判断一个8*8块中4个4*4块的系数是否为0。
2 帧内预测
H.264中Intra_16*16亮度块和8*8色度块都有4种预测模式(垂直、水平、直流、平面),AVS-M中8*8色度块只有3种(垂直、水平、直流),H.264中Intra_4*4和AVS-M中的4*4亮度块都有9种预测模式,但排列顺序不一样。H.264中的Intra_4*4和AVS-M中的4*4亮度块的模式可以通过邻块的帧内模式来预测,预测方法不同。H.264中,当前亮度块的最可能模式由左块(A)、上块(B)中较小的决定,如果相邻块不存在,则A、B模块的模式置为DC。而预测模式的选定要看码流中标志信息 prev_intra4*4_pred_mode,该标志为1时,则用最可能模式,该标志不为0时,还需看参数rem_intra4*4_pred_mode,如果它小于最可能模式,则预测模式即为rem_intra4*4_pred_mode,否则为rem_intra4*4_pred_mode+1。AVS-M中,左块(A)、上块(B)的预测模式(若不存在,置为-1)形成表格后,通过查表可获得当前块的最可能模式。对I_Direct,其预测模式即为最可能模式;对I_4*4,需看标志信息pred_mode_flag,该标志为0时,预测模式即为最可能模式;该标志为1时,当码流中读到的intra_luma_pred_mode小于最可能模式,则预测模式为最可能模式,否则,预测模式为intra_luma_pred_mode+1。另外, H.264中的Intra_16*16和色度预测模式从码流中读取,AVS-M的色度预测模式也从码流中读取。
3 帧间预测
两标准下亮度块的运动矢量等于预测运动矢量(MVPred)加上比特流中读取到的运动矢量差(MVD)。由于亮度MV精度为1/4像素,而色度精度为1/8像素,因此,色度块的运动矢量等于亮度块的两倍。AVS-M和H.264的当前亮度块E和邻块A、B、C、D的空间位置分别如图2、3所示。E的大小可以是16*16、16*8、8*16、8*8、8*4、4*8或4*4。显然,AVS-M中,A是与E的左下角样本紧邻的块,B、D与E的左上角样本紧邻的块,C是与E的右上角样本紧邻的块。H.264中,A是与E的左上角样本紧邻的块,B、D与E的左上角样本紧邻的块,C是与E的右上角样本紧邻的块。
AVS-M预测块邻块位置
H.264预测块邻块位置
4 熵解码
H.264中采用基于上下自适应的可变长编码(CAVLC),其原理: 4*4块残差数据经整数变换、量化后非零系数主要集中在低频部分,高频系数大部分是零,且高频位置上非零系数值大部分是+1和-1。AVS-M熵编码也采用变长编码技术,在AVS-M熵编码过程中,所有的语法元素和残差数据都是以指数哥伦布码的形式映射成二进制比特流。
5 环路滤波
两标准都是采用基于块的残差系数反变换、反量化,量化过程相对粗糙,反量化恢复的变换系数必定带来误差,另一方面,运动补偿块可能来自不同帧位置的内插样本块,将导致边界不连续,因此,需采用环路滤波来消除块预测误差造成的失真。H.264中根据相邻块模式、参考索引、运动矢量和解码块确定滤波强度,滤波强度参数Bs值为0~4,对于Bs为1~3的采用4抽头滤波器,对于Bs为4的采用6抽头滤波器。H.264中滤波器能适应片级、边界级和样点级的需要。而在AVS-M中根据当前宏块是帧内(帧间)编码宏块来选择帧内(帧间)滤波器,当满足滤波条件后,采用4抽头滤波器对边界先垂直后水平滤波。AVS-M滤波器相对H.264而言,像素少,强度弱,但在消除方块效应的同时能大大地减少滤波时间。
应用前景
直播卫星电视和高清电视是其中进展最快的项目。与整机厂商互动,AVS标准组可从实际应用中得到反馈,对标准、实现算法、软件、IP内核、专用芯片进行及时的修改和改进,从而真正适应产业的需求。
上广电主持的卫星电视实验系统项目中的AVS编码器则采用了“转码器+DSP”的实现方案。该系统高度兼容MPEG-2,这是由于MPEG-2的节目较多,所以AVS与它有一个融合-取代的过程。如加密、用户管理、收费系统、编辑系统等其他配套系统不变。
总结
由上分析可知,两种视频解码器结构有很多共同之处。目前,关于H.264视频解码器的优化、硬件移植的方法及其应用很多,这些也可被AVS-M采纳。本文根据优化H.264的相关文献中的一些方法对AVS-M作过软件上的优化。算法上的优化主要包括插值、环路滤波和熵解码的优化。插值时可以将像素分为内部像素和边界像素,避免重复的判断。环路滤波时每个4*4块中的每个点有相同的边界门限,其相应的滤波操作也可以4次完成。熵解码时,可通过重新建表减少转化程序。代码上的优化主要包括程序结构优化、循环展开、数据类型选择和数据的移动等,例如,Decode_one_macroblock函数中,可根据宏块类型采用不同的函数来解码,对临时的缓存区可简化。此外,对插值运算(可转化为矩阵运算)、反量化和反变换等涉及到矩阵运算的函数都可使用MMX/SSE指令集优化。
H.264是国际通用标准,而AVS-M是我国自主制定的标准,因而,两标准兼容的视频解码器的出现是种必然。本课题接下来的工作即是在对已有结构对比分析的基础上结合两套代码,将两解码器结构相同部分进行复用,不同部分通过开关进行选择,实现对两种不同格式的码流进行识别并实时解码。