当我们接收RTP承载的音视频数据,并且使用一些开源的播放库时,都需要先将RTP的头去掉,若RTP头是没有带拓展数据的,那去掉相对应的12个byte就可以,但是当带有RTP拓展头时就比较麻烦。
一、RTP标准头
1. RTP头带有RTP的相应信息
(1) V:RTP协议的版本号,占2位,当前协议版本号为2
(2)P:填充标志,占1位,如果P=1,则在该报文的尾部填充一个或多个额外的八位组,它们不是有效载荷的一部分。
(3)X:扩展标志,占1位,如果X=1,则在RTP报头后跟有一个扩展报头
(4) CC:CSRC计数器,占4位,指示CSRC 标识符的个数
(5) M: 标记,占1位,不同的有效载荷有不同的含义,对于视频,标记一帧的结束;对于音频,标记会话的开始。
(6) PT: 有效荷载类型,占7位,用于说明RTP报文中有效载荷的类型,如GSM音频、JPEM图像等,在流媒体中大部分是用来区分音频流和视频流的,这样便于客户端进行解析。
(7) 序列号:占16位,用于标识发送者所发送的RTP报文的序列号,每发送一个报文,序列号增1。这个字段当下层的承载协议用UDP的时候,网络状况不好的时候可以用来检查丢包。同时出现网络抖动的情况可以用来对数据进行重新排序,序列号的初始值是随机的,同时音频包和视频包的sequence是分别记数的。
(8) 时戳(Timestamp):占32位,必须使用90 kHz 时钟频率。时戳反映了该RTP报文的第一个八位组的采样时刻。接收者使用时戳来计算延迟和延迟抖动,并进行同步控制。
(9) 同步信源(SSRC)标识符:占32位,用于标识同步信源。该标识符是随机选择的,参加同一视频会议的两个同步信源不能有相同的SSRC。
SSRC表示一个会话的标识,能够区别开多路推拉流。
(10) 特约信源(CSRC)标识符:每个CSRC标识符占32位,可以有0~15个。每个CSRC标识了包含在该RTP报文有效载荷中的所有特约信源。
CSRC则表示一个混合器的标识,可能有多条流进入到一个混合器混合出一条流,而CSRC则带有之前多条流的SSRC以及标识资深。
2.去掉RTP标准头
RTP标准头就是12个byte,若只是需要放入开源播放库的话,直接跳过即可,最好不要用memcpy拷贝。
二、RTP拓展头
1. RTP拓展头有两种类型: one-byte 和 two-byte
one-byte简单理解就是每一个拓展数据的ID和长度存在一个Byte里,而two-byte就是ID和长度存在两个Byte里。
one-byte:
two-byte:
one-byte的开头是0xBE 和 0xDE ,two-byte的开头是0x10 0x00 ,接下来两个字节是表示拓展数据的总大小。拓展数据是以32bit对齐的。
2.去掉拓展头
(1)首先需要先判断是否有拓展头
拓展标志在第一个byte的第四个bit中,所以我们需要先做按位或运算判断是否有拓展头。
也就是拿到第一个byte后或上 0xEF (11101111)
若结果是0xEF(11101111),则拓展位为0,无拓展头。按无拓展头去掉12byte处理。
如果结果是0xFF(11111111),则拓展位为1,有拓展头。
(2)判断拓展长度
拓展头是按照32bit,也就是4个byte对齐的,所以只需要根据拓展数据总长度来计算即可,例如当L=3时,则总长度为3*4=12byte,跳过12个byte即可。
拓展数据总长度在15、16位 算出长度后*4即可。
下面上代码:
若是使用char*来装数据的话就要换算成char范围内对应的数值,x < 128的就是正常表示x = x,若x >= 128,则x = (x-127)-128
bool hasExtension = false;
char *pDataBuf;
int extensionDataSize = 0;
if ((rtpData[0] | -17) == -1)//有拓展头,-17 为 11101111,| 上后可得出拓展位 -1为255
{
//计算拓展数据长度 第15 16位为总拓展数据长度
//下列这种转换是否有一种更好的方法?
if (rtpData[14] < 0)
{
extensionDataSize = (rtpData[14] + 256)*16;
}
else
{
extensionDataSize = rtpData[14]*16;
}
if (rtpData[15] < 0)
{
extensionDataSize += (rtpData[15] + 256) ;
}
else
{
extensionDataSize += rtpData[15];
}
pDataBuf = rtpData+ 16 + extensionDataSize*4;
nDataSize -= (16 + extensionDataSize*4);
}
else if ((rtpData[0] | -17) == -17)//无拓展头,只去掉RTP12位标准头
{
pDataBuf = rtpData+ 12;
nDataSize -= 12;
}
同样的,如果要获取拓展数据或者仅去掉其中一部分的拓展数据,则计算二进制按位或即可。