【数据压缩】H.264文件解析和码流分析

一、实验课要求

  1. 选择一个.mp4或者.264文件。
  2. 在码流分析仪软件中打开该文件,从几个层次进行分析:
  • 分析SPS和PPS里都包含哪些主要的信息,给出参数值。(例如分辨率、帧率、GOP结构等等)
  • 以一个GOP为例,分析如下信息:
    1. 每个图像帧的类型及所用的编码比特数、QP值;并以图像帧号为横坐标、每帧所用比特数为纵坐标画出曲线图;以图像帧号为横坐标、每帧所用QP为纵坐标画出曲线图。
    2. 以第一个I帧作为分析对象,基于该帧图像的空间特性,分析每个宏块所采用的编码类型及其比例。
    3. 以第一个P帧作为分析对象,基于该帧图像的空间和时间特性,分析每个宏块所采用的编码类型及其比例。
    4. 以某一个B帧作为分析对象,基于该帧图像的空间和时间特性,分析每个宏块所采用的编码类型及其比例。

二、实验内容

在这里插入图片描述
首先是SPS:
profile_idc:

(1) profile_idc:

标识当前H.264码流的profile。我们知道,H.264中定义了三种常用的档次profile:

基准档次:baseline profile;

主要档次:main profile;

扩展档次:extended profile;

在H.264的SPS中,第一个字节表示profile_idc,根据profile_idc的值可以确定码流符合哪一种档次。判断规律为:

profile_idc = 66 → baseline profile;

profile_idc = 77 → main profile;

profile_idc = 88 → extended profile;

在新版的标准中,还包括了High、High 10、High 4:2:2、High 4:4:4、High 10 Intra、High
4:2:2 Intra、High 4:4:4 Intra、CAVLC 4:4:4 Intra等,每一种都由不同的profile_idc表示。

另外,constraint_set0_flag ~ constraint_set5_flag是在编码的档次方面对码流增加的其他一些额外限制性条件。

在我们实验码流中,profile_idc = 0x42 = 66,因此码流的档次为baseline profile。

constraint_set0_flag ~ constraint_set5_flag

另外,constraint_set0_flag ~ constraint_set5_flag是在编码的档次方面对码流增加的其他一些额外限制性条件。

在我们实验码流中,profile_idc = 0x42 = 66,因此码流的档次为baseline profile。
在这里插入图片描述

level_idc

标识当前码流的Level。编码的Level定义了某种条件下的最大视频分辨率、最大视频帧率等参数,码流所遵从的level由level_idc指定。

当前码流中,level_idc =31,对应表如下:

在这里插入图片描述
表示该H264码流支持到720p 高清格式,支持隔行扫描,每秒的样点数是27648000

seq_parameter_set_id

表示当前的序列参数集的id。通过该id值,图像参数集pps可以引用其代表的sps中的参数。

log2_max_frame_num_minus4

用于计算MaxFrameNum的值。计算公式为MaxFrameNum = 2^(log2_max_frame_num_minus4 +4)。MaxFrameNum是frame_num的上限值,frame_num是图像序号的一种表示方法,在帧间编码中常用作一种参考帧标记的手段。

在本例中,MaxFrameNum = 2 ^ ( 4 + 4 ) = 256

pic_order_cnt_type

表示解码picture order count(POC)的方法。POC 是另一种计量图像序号的方式,与frame_num有着不同的计算方法。该语法元素的取值为 0、1 或 2
在本例中, frame_num = 2

gaps_in_frame_num_value_allowed_flag

标识位,说明frame_num中是否允许不连续的值。

在本例中, gaps_in_frame_num_value_allowed_flag = 0,表示不允许不连续的值。

pic_width_in_mbs_minus1

用于计算图像的宽度。单位为宏块个数,因此图像的实际宽度为:

frame_width = 16 × (pic_width_in_mbs_minus1 + 1);

(54+1)*16=880

pic_height_in_map_units_minus1

使用PicHeightInMapUnits来度量视频中一帧图像的高度。PicHeightInMapUnits并非图像明确的以像素或宏块为单位的高度,而需要考虑该宏块是帧编码或场编码。PicHeightInMapUnits的计算方式为:

PicHeightInMapUnits = pic_height_in_map_units_minus1 + 1;

pic_height_in_map_units_minus1 为29 故高度为30

frame_mbs_only_flag

标识位,说明宏块的编码方式。当该标识位为0时,宏块可能为帧编码或场编码;该标识位为1时,所有宏块都采用帧编码。根据该标识位取值不同,PicHeightInMapUnits的含义也不同,为0时表示一场数据按宏块计算的高度,为1时表示一帧数据按宏块计算的高度。

按照宏块计算的图像实际高度FrameHeightInMbs的计算方法为:

FrameHeightInMbs = ( 2 − frame_mbs_only_flag ) * PicHeightInMapUnits

故FRameHeightInMbs为30

mb_adaptive_frame_field_flag

标识位,说明是否采用了宏块级的帧场自适应编码。当该标识位为0时,不存在帧编码和场编码之间的切换;当标识位为1时,宏块可能在帧编码和场编码模式之间进行选择。

direct_8x8_inference_flag

标识位,用于B_Skip、B_Direct模式运动矢量的推导计算。

frame_cropping_flag

标识位,说明是否需要对输出的图像帧进行裁剪。

vui_parameters_present_flag

标识位,说明SPS中是否存在VUI信息。

PPS

本例中的pps如下:
在这里插入图片描述

可知图像分辨率:
pic_width_in_mbs_minusl=39 实际宽度(39+1)*40=640
pic_height_in_map_units_minus1=22
frame_mbs_only_flag=1 表示所有宏块都采用帧编码,同时也表示一帧数据按宏块计算的高度,即按宏块计算的实际高度16 × 23 = 368
GOP结构:
num_slice_groupes_minusl=0 该图像帧中只有一个Slice group

以一个GOP为例,以图像帧号为横坐标、每帧所用比特数为纵坐标画出曲线图;以图像帧号为横坐标、每帧所用QP为纵坐标画出曲线图。

在这里插入图片描述

可知第一个GOP长度为165,导出其statistic数据可知比特数;H264Visa的statistics窗口可看到mean QP值。

输出帧号为0-164的数据并做图:(按解码时间DTS排列:IPBBPB…)
在这里插入图片描述
查找0-164每一帧的QP并记录:(以显示时间PTS排序:IBBPBPB…)

每帧所用比特数曲线:
在这里插入图片描述

以帧作为分析对象,基于该帧图像的空间特性,分析每个宏块所采用的编码类型及其比例。

在这里插入图片描述
大部分为8x8和16x16的宏块,细节较多的地方用更细的4x4:

在这里插入图片描述
大部分为p_skip宏块,因为前后图像变化不大,也有个别采用前向预测(I帧)和帧内编码以弥补差异较大的细节部分。

三、参考:

https://blog.csdn.net/heanyu/article/details/6204414
https://zhuanlan.zhihu.com/p/27896239

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值