1. 网络抽象层单元类型(NALU)
NALU 头由一个字节组成, 它的语法如下:
+===============+
|0|1|2|3|4|5|6|7|
+=+=+=+=+=+=+=+=+
|F|NRI| Type |
+===============+
F: 1 个比特.
forbidden_zero_bit:在H.264规范中规定了这一位必须为0。
NRI: 2 个比特.
nal_ref_idc:取00~11,似乎指示这个NALU的重要性, 如00的NALU解码器可以丢弃它而不影响图像的回放。不过一般情况下不太关心
这个属性。
Type: 5 个比特.
nal_unit_type:这个NALU单元的类型。简述如下:
0 没有定义
1-23 NAL单元 单个NAL单元包
24 STAP-A 单一时间的组合包
25 STAP-B 单一时间的组合包
26 MTAP16 多个时间的组合包
27 MTAP24 多个时间的组合包
28 FU-A 分片的单元
29 FU-B 分片的单元
30-31 没有定义
2. 打包模式
下面是RFC 3550中规定的RTP头的结构.
0 1 2 3
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|V=2|P|X| CC |M| PT | sequence number |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| timestamp |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| synchronization source (SSRC) identifier |
+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+=+
| contributing source (CSRC) identifiers |
| .... |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
负载类型 Payload type (PT): 7 bits
序列号 Sequence number (SN): 16 bits
时间戳 Timestamp: 32 bits
H.264 Payload格式定义了三种不同的基本的负载(Payload)结构. 接收端可能通过RTP Payload的第一个字节来识别它们. 这一个字节类似NALU头的格式, 而这个头结构的NAL单元类型字段则指出了代表的是哪一种结构,这个字节的结构如下, 可以看出它和H.264的NALU头结构是一样的.
+===============+
|0|1|2|3|4|5|6|7|
+=+=+=+=+=+=+=+=+
|F|NRI| Type |
+===============+
字段 Type: 这个RTP payload中NAL单元的类型. 这个字段和H.264中类型字段的区别是, 当type的值为24 ~ 31表示这是一个特别格式的NAL单元, 而H.264中, 只取1~23是有效的值.
24 STAP-A 单一时间的组合包
24 STAP-B 单一时间的组合包
26 MTAP16 多个时间的组合包
27 MTAP24 多个时间的组合包
28 FU-A 分片的单元
29 FU-B 分片的单元
30-31 没有定义
可能的结构类型分别有:
1. 单一NAL单元模式
即一个RTP包仅由一个完整的NALU组成. 这种情况下RTP NAL头类型字段和原始的H.264的NALU头类型字段是一样的.
2. 组合封包模式
即可能是由多个NAL单元组成一个RTP包. 分别有4种组合方式: STAP-A, STAP-B, MTAP16, MTAP24.那么这里的类型值分别是24, 25, 26以及27.
3. 分片封包模式
用于把一个NALU单元封装成多个RTP包. 存在两种类型FU-A和FU-B. 类型值分别是28和29.
2.1 单一NAL单元模式
对于NALU的长度小于MTU大小的包, 一般采用单一NAL单元模式.
对于一个原始的H.264 NALU单元常由[Start Code] [NALU Header] [NALU Payload]三部分组成, 其中Start Code用于标示这是一个NALU 单元的开始, 必须是 "00 00 00 01"或"00 00 01", NALU头仅一个字节, 其后都是NALU单元内容.
打包时去除"00 00 01"或"00 00 00 01"的开始码, 把其他数据封包成RTP包即可.
0 1 2 3
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|F|NRI| type | |
+-+-+-+-+-+-+-+-+ |
| |
| Bytes 2..n of a Single NAL unit |
| |
| +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| :...OPTIONAL RTP padding |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
如有一个H.264的NALU是这样的:
[00 00 00 01 67 42 A0 1E 23 56 0E 2F ... ]
这是一个序列参数集NAL单元. [00 00 00 01]是四个字节的开始码, 67是NALU头, 42开始的数据是NALU内容.
封装成RTP包将如下:
[RTP Header] [67 42 A0 1E 23 56 0E 2F]
即只要去掉4个字节的开始码就可以了.
2.2 组合封包模式
其次, 当NALU的长度特别小时, 可以把几个NALU单元封在一个RTP包中.
0 1 2 3
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| RTP Header |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
|STAP-A NAL HDR | NALU 1 Size | NALU 1 HDR |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| NALU 1 Data |
: :
+ +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| | NALU 2 Size | NALU 2 HDR |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| NALU 2 Data |
: :
| +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| :...OPTIONAL RTP padding |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
2.3 Fragmentation Units (FUs).
而当NALU的长度超过MTU时, 就必须对NALU单元进行分片封包. 也称为 Fragmentation Units(FUs).
0 1 2 3
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9 0 1
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| FU indicator | FU header | |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+ |
| |
| FU payload |
| |
| +-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| :...OPTIONAL RTP padding |
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
Figure 14. RTP payload format for FU-A
The FU indicator octet has the following format:
+===============+
|0|1|2|3|4|5|6|7|
+=+=+=+=+=+=+=+=+
|F|NRI| Type |
+===============+
The FU header has the following format:
+===============+
|0|1|2|3|4|5|6|7|
+=+=+=+=+=+=+=+=+
|S|E|R| Type |
+===============+
3. SDP参数
下面描述了如何在SDP中表示一个H.264流:
. "m=" 行中的媒体名必须是 "video"
. "a=rtpmap" 行中的编码名称必须是 "H264".
. "a=rtpmap" 行中的时钟频率必须是 90000.
. 其他参数都包括在"a=fmtp"行中.
如:
m=video 49170 RTP/AVP 98
a=rtpmap:98 H264/90000
a=fmtp:98 profile-level-id=42A01E; sprop-parameter-sets=Z0IACpZTBYmI,aMljiA==
下面介绍一些常用的参数.
3.1 packetization-mode:
表示支持的封包模式.
当 packetization-mode 的值为 0 时或不存在时, 必须使用单一NALU单元模式.
当 packetization-mode 的值为 1 时必须使用非交错(non-interleaved)封包模式.
当 packetization-mode 的值为 2 时必须使用交错(interleaved)封包模式.
这个参数不可以取其他的值.
3.2 sprop-parameter-sets:
这个参数可以用于传输H.264的序列参数集和图像参数NAL单元. 这个参数的值采用Base64进行编码. 不同的参数集间用","号隔开.
3.3 profile-level-id:
这个参数用于指示H.264流的profile类型和级别. 由Base16(十六进制)表示的3个字节. 第一个字节表示H.264的Profile类型, 第三个字节表示H.264的Profile级别.
3.4 max-mbps:
这个参数的值是一个整型, 指出了每一秒最大的宏块处理速度
NALU的类型
NALU(NAL单元)的顺序要求
NALU类型