一般来说,一帧音频数据的数据量是很小的,在RTSP传输中,一个RTP包就可以传,不需要经过FU-A等形式分包。因此,一个承载一帧AAC的RTP,应该是这样的:
12 Byte | 2Byte | 2Byte | remaining Byte
RTP Header | AU Header Lengh | AU Header | AAC data
如果说RTSP Server端传过来的AAC数据是带有ADTS的,想只取AAC音频内容,就需要将AAC数据偏移7字节,因为ADTS占字节。