1、前言
RTP/RTCP协议设计用来传输音视频数据,对应的RFC文档为:RFC3550,对应的中文版RFC3550中文版
RTP被定义为在一对一或者一对多的传输情况下工作,其目的是为了提供时间信息和实现流同步。RTP的典型应用是建立在UDP上的,也可以建立在TCP等其它协议之上进行工作,一般将其看作传输层的一部分,位于UDP层之上,应用层之下,它不保证数据传输的可靠性
RTCP为RTP提供服务质量保证,其主要功能为:服务质量的监视与反馈、媒体间的同步,以及多播组中成员的标识。RTCP协议是基于每隔一段时间给会话的所有参与者发送一些控制包的机制。RTCP包中包含有已发送的数据包的数量、丢失的数据包的数量等统计资料,从而各参与者可以利用这些信息动态的改变传输速率。
2、RTP数据包构成
RTP数据包一般由:Header+有效载荷数据:构成,Header一般为12字节,有效载荷数据则可以是音频数据,h264码流,PS码流等等
-
RTP头部组成 头部一般至少包含12个固定字节,也包括若扩展干字节。
1字节 V(2bit)+P(1bit)+X(1bit)+CC(4bit) 2字节M(1bit)+PT(7bit) 3 4字节SN(序列号) 5 6 7 8字节timestamp(4字节) 9 10 11 12字节SSRC[13 14 15 16字节CSRC(4字节,可选 可以有多个,数量为前面CC的值大小)....] [扩展头部...当前面X==1时才有]
如下图片,其中当CC的值大于0时,CSRC为扩展字节。
image.png
1、版本号(V):占2位,用来标志使用的RTP版本。 2、填充位(P):占1位,如果P=1,则该RTP包的尾部包含附加的填充字节。3、作用是为了字节对齐,填充字节的数量保存在最后一个字节中 4、扩展位(X):占1位,如果X=1,则RTP固定头部后面就跟有一个扩展头部,即上面的CSRC信息 5、CSRC计数器(CC):占4位,指示 CSRC标识符的数量。 标记位(M):占1位,当M=1时,对于视频流, 它表示一帧的结束,而对于音频,则表示一次谈话的开始。 6、载荷类型(PT):占7位,标识了RTP载荷的类型,比如是视频还是音频类型 7、序列号(SN):占16位,发送方在每发送完一个RTP包后就将该域的值增加1,接收方可以由该域检测包的丢失及恢复包序列。序列号的初始值是随机的。 8、时间戳(timestamp):占32位,记录了该包中数据的第一个字节的采样时刻。在一次会话开始时,时间戳初始化成一个初始值(随机生成)。即使在没有信号发送时,时间戳的数值也要随时间而不断地增加。时间戳是去除抖动和实现同步不可缺少的。 9、同步源标识符(SSRC):占32位,用来表示RTP包的类型,每次开启新的流会话该值都会变化 10、特约信源(CSRC):每个CSRC标识符占32位,可以有0~15个,每个CSRC 标识了包含在该RTP报文有效载荷中的所有特约信源。当CC>0时有此信息扩展信息XXXX:定义的扩展信息,当X为1时有此信息