一、实验要求
- 选择一个.mp4或者.264文件。
- 在码流分析仪软件中打开该文件,从几个层次进行分析:
- 分析SPS和PPS里都包含哪些主要的信息,给出参数值。(例如分辨率、帧率、GOP结构等等)
- 以一个GOP为例,分析如下信息:
- 每个图像帧的类型及所用的编码比特数、QP值;并以图像帧号为横坐标、每帧所用比特数为纵坐标画出曲线图;以图像帧号为横坐标、每帧所用QP为纵坐标画出曲线图。
- 以第一个I帧作为分析对象,基于该帧图像的空间特性,分析每个宏块所采用的编码类型及其比例。
- 以第一个P帧作为分析对象,基于该帧图像的空间和时间特性,分析每个宏块所采用的编码类型及其比例。
- 以某一个B帧作为分析对象,基于该帧图像的空间和时间特性,分析每个宏块所采用的编码类型及其比例。
二、实验过程
1.SPS和PPS分析
SPS(序列参数集):
(1) profile_idc:
标识当前H.264码流的profile。H.264中定义了三种常用的档次profile:
基准档次:baseline profile;
主要档次:main profile;
扩展档次:extended profile;
profile_idc = 77,码流档次为main profile。
(2) level_idc
标识当前码流的Level。编码的Level定义了某种条件下的最大视频分辨率、最大视频帧率等参数,码流所遵从的level由level_idc指定。
level_idc = 0x1e = 30,码流的级别为3。
(3) seq_parameter_set_id
表示当前的序列参数集的id。通过该id值,图像参数集pps可以引用其代表的sps中的参数。
seq_parameter_set_id=0,当前的序列参数集的id=0。
(4) log2_max_frame_num_minus4
用于计算MaxFrameNum的值。计算公式为
MaxFrameNum = 2^(log2_max_frame_num_minus4 + 4)。
MaxFrameNum是frame_num的上限值,frame_num是图像序号的一种表示方法,在帧间编码中常用作一种参考帧标记的手段。
log2_max_frame_num_minus4=1,MaxFrameNum = 16.
(5) pic_order_cnt_type
表示解码picture order count(POC)的方法。POC是另一种计量图像序号的方式,与frame_num有着不同的计算方法。该语法元素的取值为0、1或2。
pic_order_cnt_type=0。
(6) log2_max_pic_order_cnt_lsb_minus4
用于计算MaxPicOrderCntLsb的值,该值表示POC的上限。计算方法为MaxPicOrderCntLsb = 2^(log2_max_pic_order_cnt_lsb_minus4 + 4)。
log2_max_pic_order_cnt_lsb_minus4=2,MaxPicOrderCntLsb = 32.
(7) num_ref_frames
用于表示参考帧的最大数目。
num_ref_frames=2.
(8) gaps_in_frame_num_value_allowed_flag
标识位,说明frame_num中是否允许不连续的值。
gaps_in_frame_num_value_allowed_flag=0.
(9) pic_width_in_mbs_minus1
本句法元素加 1 后指明图像宽度,以宏块为单位:
PicWidthInMbs = pic_width_in_mbs_minus1 + 1
通过这个句法元素解码器可以计算得到亮度分量以像素为单位的图像宽度:
PicWidthInSamplesL = PicWidthInMbs * 16
pic_width_in_mbs_minus1=22,PicWidthInSamplesL = 368.
(10) pic_height_in_map_units_minus1
计算图像的高度:
PicHeight=16∗(pic_height_in_map_units_minus1+1)
pic_height_in_map_units_minus1=29,PicHeight=480.
(11) frame_mbs_only_flag
标识位,说明宏块的编码方式。当该标识位为0时,宏块可能为帧编码或场编码;该标识位为1时,所有宏块都采用帧编码。根据该标识位取值不同,PicHeightInMapUnits的含义也不同,为0时表示一场数据按宏块计算的高度,为1时表示一帧数据按宏块计算的高度。
按照宏块计算的图像实际高度FrameHeightInMbs的计算方法为:
FrameHeightInMbs = ( 2 − frame_mbs_only_flag ) * PicHeightInMapUnits
frame_mbs_only_flag =1,FrameHeightInMbs =30,图像的实际高度为480.
(12) direct_8x8_inference_flag
标识位,用于B_Skip、B_Direct模式运动矢量的推导计算。
direct_8x8_inference_flag=1.
(14) frame_cropping_flag
标识位,说明是否需要对输出的图像帧进行裁剪。
frame_cropping_flag=1。
(15) vui_parameters_present_flag
标识位,说明SPS中是否存在VUI信息。
vui_parameters_present_flag=1.
PPS(图像参数集):
(1) pic_parameter_set_id
表示当前PPS的id。某个PPS在码流中会被相应的slice引用,slice引用PPS的方式就是在Slice header中保存PPS的id值。该值的取值范围为[0,255]。
pic_parameter_set_id=0.
(2) seq_parameter_set_id
表示当前PPS所引用的激活的SPS的id。通过这种方式,PPS中也可以取到对应SPS中的参数。该值的取值范围为[0,31]。
seq_parameter_set_id=0.
(3) entropy_coding_mode_flag
熵编码模式标识,该标识位表示码流中熵编码/解码选择的算法。对于部分语法元素,在不同的编码配置下,选择的熵编码方式不同。例如在一个宏块语法元素中,宏块类型mb_type的语法元素描述符为“ue(v) | ae(v)”,在baseline profile等设置下采用指数哥伦布编码,在main profile等设置下采用CABAC编码。
标识位entropy_coding_mode_flag的作用就是控制这种算法选择。当该值为0时,选择左边的算法,通常为指数哥伦布编码或者CAVLC;当该值为1时,选择右边的算法,通常为CABAC。
entropy_coding_mode_flag=1,选择右边的算法,通常为CABAC。
(4)pic_order_present_flag
POC的三种计算方法在片层还各需要用一些句法元素作为参数,本句法元素等于1时表示在片头会有句法元素指明这些参数;本句法元素等于0时,表示片头不会给出这些参数,这些参数使用默认值。
pic_order_present_flag=0.
(5) num_slice_groups_minus1
表示某一帧中slice group的个数。当该值为0时,一帧中所有的slice都属于一个slice group。
num_slice_groups_minus1=0.
(6) num_ref_idx_l0_default_active_minus1、num_ref_idx_l1_default_active_minus1
表示当Slice Header中的num_ref_idx_active_override_flag标识位为0时,P/SP/B slice的语法元素num_ref_idx_l0_active_minus1和num_ref_idx_l1_active_minus1的默认值。
num_ref_idx_l0_default_active_minus1=0,num_ref_idx_l1_default_active_minus1=0.
(7) weighted_pred_flag
标识位,表示在P/SP slice中是否开启加权预测。
weighted_pred_flag=0.
(8) weighted_bipred_idc
表示在B Slice中加权预测的方法,取值范围为[0,2]。0表示默认加权预测,1表示显式加权预测,2表示隐式加权预测。
weighted_bipred_idc=0.
(9) pic_init_qp_minus26和pic_init_qs_minus26
表示初始的量化参数。实际的量化参数由该参数、slice header中的slice_qp_delta/slice_qs_delta计算得到。
pic_init_qp_minus26=0,pic_init_qs_minus26=0.
(10) chroma_qp_index_offset
用于计算色度分量的量化参数,取值范围为[-12,12]。
chroma_qp_index_offset=0.
(11) deblocking_filter_control_present_flag
标识位,用于表示Slice header中是否存在用于去块滤波器控制的信息。当该标志位为1时,slice header中包含去块滤波相应的信息;当该标识位为0时,slice header中没有相应的信息。
deblocking_filter_control_present_flag=1.
(12) constrained_intra_pred_flag
若该标识为1,表示I宏块在进行帧内预测时只能使用来自I和SI类型宏块的信息;若该标识位0,表示I宏块可以使用来自Inter类型宏块的信息。
constrained_intra_pred_flag=0.
(13) redundant_pic_cnt_present_flag
标识位,用于表示Slice header中是否存在redundant_pic_cnt语法元素。当该标志位为1时,slice header中包含redundant_pic_cnt;当该标识位为0时,slice header中没有相应的信息。
redundant_pic_cnt_present_flag=0.
2.以一个GOP为例,分析如下
生成csv文件,以图像帧号为横坐标、每帧所用比特数为纵坐标画出曲线图:
第一个I帧:
该帧为I帧,类型为帧内预测编码,所用的编码比特数为118.783,QP值为22.081.
I帧的所有块为I类型。
第一个B帧:
该帧为B帧,类型为帧内预测编码和双向预测编码,数量比为11:679,所用的编码比特数为24.290,QP值为24.643.
第一个P帧:
该帧为P帧,类型为帧内预测编码和前向预测编码,数量比为117:573,所用的编码比特数为53.771,QP值为22.316.