一、来源
RFC4867协议,地址:https://www.rfc-editor.org/rfc/pdfrfc/rfc4867.txt.pdf
只解析AMR-WB的单通道多帧格式,其它参考协议文档;净荷数据是打包在RTP的荷载中。
二、净荷格式
+----------------+-------------------+------------------------------
| payload header | table of contents | speech data ...
+----------------+-------------------+------------------------------
payload header — 占8bit
table of contents — 占8bit
speech data — 语音数据
三、单通道多帧具体格式
1.格式:
0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
| CMR |R|R|R|R|F| FT |Q|P|P| speech data ...
+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+-+
CMR — 4bit,codec mode request,编码模式请求,由发送者向接受者的请求发送者编码器将来的编码速率模式,保存帧类型索引,取值范围为0-8,表示9种速率。取值15意味着当前是没有指定哪个模式的请求;
R — 总共4bit,保留位,须置为0,接收者忽略该位;
F — 1bit,用于标志是否最后一个帧,0表示最后1帧;
FT — 4bit,标志对编码模式或舒适噪志的模式,同CMR取值,取值范围为0-8,表示9种速率;
Q — 1bit,指示帧质量,为0表示对应帧被破坏,1表示未被破坏;如果该帧已被破坏,那么可以通过直接丢弃该帧来处理;
P — 总共2bit,保留位,置0。
2.CMR和FT取值
3.wireshark解析(单帧)
四、120ms打包举例解析
120ms即有6个语音帧块打成1个RTP包,AMR-WB 16KHZ采样,每个语音帧块采样320,则连续的RTP时间戳间隔将是1920,这点需要注意,而不是120ms的间隔。
1.格式
rtp header --- RTP头,包括扩展头;
payload header --- 占8bit,CMR编码模式请求;
toc1 --- 占8bit, table of contents,标志帧是否连续、编码模式、帧的好坏;
----
toc6 --- 占8bit,同toc1;
speech data --- 语音数据。
2.wireshark解析