音视频开发—H264 SPS 和 PPS 参数说明

最新推荐文章于 2025-04-03 22:56:35 发布

Trump. yang

最新推荐文章于 2025-04-03 22:56:35 发布

阅读量2.1k

点赞数 27

分类专栏：音视频开发文章标签：音视频

本文链接：https://blog.csdn.net/weixin_46999174/article/details/139379481

版权

音视频开发专栏收录该内容

22 篇文章

订阅专栏

文章目录

在H.264视频编码标准中，SPS和PPS是关键的参数集，它们提供了解码所需的各种配置信息。它们分别存储在单独的NALU中，并用于初始化解码器的参数。

序列参数集 (SPS, Sequence Parameter Set)

SPS包含关于整个视频序列的全局参数，包括视频的分辨率、帧率、颜色空间等信息。SPS NALU的 nal_unit_type 为7。

SPS的主要内容：

profile_idc (8 bits)：
- 指定编码器使用的特性集（Profile），如Baseline、Main、High等。
如下图所示

Profile描述了H.264编码器使用的特性集，定义了编码过程中允许使用的技术和工具。不同的Profile适用于不同的应用场景，主要包括以下几种：
1. Baseline Profile：
  - 适用于低延迟和低复杂度的应用，如视频会议、移动视频等。
  - 特点：支持I帧和P帧，不支持B帧；支持逐行扫描，不支持隔行扫描；支持基本的熵编码（CAVLC），不支持高级的CABAC。
2. Main Profile：
  - 适用于广播电视和存储等应用。
  - 特点：支持I帧、P帧和B帧；支持隔行扫描；支持高级的熵编码（CABAC），提供更高的压缩效率。
3. High Profile：
  - 适用于高清电视、蓝光光盘等高质量视频应用。
  - 特点：在Main Profile的基础上增加了8x8整数变换、更多的预测模式和量化矩阵等高级功能，进一步提高压缩效率和视频质量。
此外，还有其他更专业的Profile，如Extended Profile、High 10 Profile、High 4:2:2 Profile、High 4:4:4 Predictive Profile等，用于特定的专业应用场景。
constraint_set_flags (6 bits)：
- 用于指示某些编码限制和特性。
level_idc (8 bits)：
- 指定解码器的性能要求（Level），如1, 1.1, 1.2, …, 5.1等。
不同的level对应的分辨率，帧率如下图所示
seq_parameter_set_id：
- 标识符，用于区分不同的SPS。
log2_max_frame_num_minus4：
- 定义 MaxFrameNum 的值，即最大帧编号。
pic_order_cnt_type：
- 指定帧内图像顺序计数类型。
log2_max_pic_order_cnt_lsb_minus4（当 pic_order_cnt_type 为0时有效）：
- 定义 MaxPicOrderCntLsb 的值。
max_num_ref_frames：
- 最大参考帧数量。
gaps_in_frame_num_value_allowed_flag：
- 指示是否允许帧编号之间有空隙。
frame_mbs_only_flag：
- 指示视频序列是否仅包含帧宏块（不包含场宏块）。
direct_8x8_inference_flag：
- 指示是否可以在直接模式中使用8x8块。
frame_cropping_flag：
- 指示是否存在帧裁剪参数。
vui_parameters_present_flag：
- 指示是否存在VUI（视频可用性信息）参数。
VUI参数（如果 vui_parameters_present_flag 为1）：
- 包含色彩描述、时间尺度、比特率、视频格式等额外信息。

一些补充的参数如下图所示：

在这里插入图片描述

图像参数集 (PPS, Picture Parameter Set)

PPS包含关于每个图像或图像组的具体参数，指导解码器如何处理图像数据。PPS NALU的 nal_unit_type 为8。

PPS的主要内容：

pic_parameter_set_id：
- 标识符，用于区分不同的PPS。
seq_parameter_set_id：
- 关联的SPS的标识符。
entropy_coding_mode_flag：
- 指示是否使用CABAC（上下文自适应二进制算术编码）熵编码模式。
bottom_field_pic_order_in_frame_present_flag：
- 指示是否在帧内包含底部场顺序信息。
num_slice_groups_minus1：
- 指定切片组的数量。
slice_group_map_type（如果 num_slice_groups_minus1 > 0）：
- 指定切片组的映射类型。
num_ref_idx_l0_default_active_minus1 和 num_ref_idx_l1_default_active_minus1：
- 指定参考帧列表的默认数量。
weighted_pred_flag：
- 指示是否使用加权预测。
weighted_bipred_idc：
- 指定双向预测中加权预测的方法。
pic_init_qp_minus26：
- 初始量化参数（QP）相对于基准值26的偏移量。
deblocking_filter_control_present_flag：
- 指示是否存在去块滤波参数。
constrained_intra_pred_flag：
- 指示是否限制帧内预测。
redundant_pic_cnt_present_flag：
- 指示是否存在冗余图像计数。

Slice Header 结构

Slice Header的结构因Slice类型（I-Slice, P-Slice, B-Slice）和某些参数的不同而略有变化。以下是Slice Header中主要字段的详解：

first_mb_in_slice
- 表示该Slice中第一个宏块的地址（从0开始）。
slice_type
- 指示Slice的类型（I-Slice, P-Slice, B-Slice等）。
- 常见值包括：
  - 0：P-Slice
  - 1：B-Slice
  - 2：I-Slice
  - 3：SP-Slice
  - 4：SI-Slice
pic_parameter_set_id
- 指示用于该Slice的PPS的标识符。
frame_num
- 表示该Slice所属帧的帧编号。
field_pic_flag（可选）
- 指示是否为场图像（field picture）。
- 当场图像存在时，还需要bottom_field_flag。
bottom_field_flag（可选）
- 指示是否为底场（bottom field）。
idr_pic_id（当Slice为IDR片时）
- 表示IDR片的标识符。
pic_order_cnt_lsb
- 表示该Slice所属帧的图像顺序计数（LSB部分）。
delta_pic_order_cnt_bottom（当pic_order_cnt_type为0时）
- 用于计算图像顺序计数的底部增量。
delta_pic_order_cnt[0] 和 delta_pic_order_cnt[1]（当pic_order_cnt_type为1时）
- 用于计算图像顺序计数的增量。
redundant_pic_cnt
- 表示冗余图像计数。
direct_spatial_mv_pred_flag（当Slice类型为B-Slice时）
- 指示是否使用直接空间运动矢量预测。
num_ref_idx_active_override_flag
- 指示是否覆盖PPS中参考索引的默认数量。
num_ref_idx_l0_active_minus1 和 num_ref_idx_l1_active_minus1
- 指示L0和L1列表中活动参考索引的数量减1。
ref_pic_list_modification_flag_l0 和 ref_pic_list_modification_flag_l1
- 指示是否修改参考图像列表。
dec_ref_pic_marking
- 包含参考图像标记信息，用于管理参考图像缓存。
cabac_init_idc
- 表示CABAC初始化索引。
slice_qp_delta
- 表示该Slice的量化参数（QP）的增量。
sp_for_switch_flag（当Slice类型为SP-Slice时）
- 指示是否为切换SP-Slice。
slice_qs_delta（当Slice类型为SP-Slice或SI-Slice时）
- 表示该Slice的QS（量化步长）的增量。
disable_deblocking_filter_idc
- 指示是否禁用去块滤波。
slice_alpha_c0_offset_div2 和 slice_beta_offset_div2
- 表示去块滤波器的α和β参数偏移量。
slice_group_change_cycle
- 指示切片组更改周期。