计算音频帧的播放时间(音频码流音频帧)

最新推荐文章于 2023-05-26 00:05:09 发布

GoRustNeverStop

最新推荐文章于 2023-05-26 00:05:09 发布

阅读量1.4k

点赞数

分类专栏： AAC

AAC 专栏收录该内容

15 篇文章 2 订阅

订阅专栏

音频码流（冗余数据占的比例）：

先简单讲一下对于ADTS header的结构的理解：

1）ADTS header位于每一个aac帧的开头，长度一般是7字节（也可以是9字节的，没见过）。

2）每个aac帧的长度固定为1024个sample（可以是1024*n，没见过n>1的情况）。

3）ADTS header中大部分信息无用，有用的只有采样率(4bit)、声道数(3bit)和帧的大小(13bit)，这三项总共只有20bit。

mp4格式会集中存放每一个frame的index，每个index占4个字节。但因为mp4本身还有其他tag，所以对于较短的小文件冗余依然比ADTS大。

如一个20kpbs的48kHz he-aac语音，如果用ADTS存放，冗余数据占的比例可以这么计算

1、每秒的音频数据量是20/8=2560 Byte；

2、每秒的音频帧数是24000/1024=23.4375帧；（由于编码的aac算法是he-aac，它自带sbr技术，因此SBR只有一半的采样率）待实际验证

3）每秒ADTS header的大小是7*23.4375=164.0625 Byte

4) 冗余数据占的比例是164.0625 / 2560 = 6.4%

可见还是相当大的

mp4格式会集中存放每一个frame的index，每个index占4个字节。但因为mp4本身还有其他tag，所以对于较短的小文件冗余依然比ADTS大。

===============================================================================================

采样频率是指将模拟声音波形进行数字化时，每秒钟抽取声波幅度样本的次数。

。正常人听觉的频率范围大约在20Hz~20kHz之间，根据奈奎斯特采样理论，为了保证声音不失真，采样频率应该在40kHz左右。常用的音频采样频率有8kHz、11.025kHz、22.05kHz、16kHz、37.8kHz、44.1kHz、48kHz等，如果采用更高的采样频率，还可以达到DVD的音质

对采样率为44.1kHz的AAC音频进行解码时，一帧的解码时间须控制在23.22毫秒内。

背景知识:

(一个AAC原始帧包含一段时间内1024个采样及相关数据)根据aac文档

分析：

1 AAC

音频帧的播放时间=一个AAC帧对应的采样样本的个数/采样频率(单位为s)

一帧 1024个 sample。采样率 Samplerate 44100KHz，每秒44100个sample,

所以根据公式

音频帧的播放时间=一个AAC帧对应的采样样本的个数/采样频率

（NOTE：该时间可作解码时间的参考，解码时间应偏差确保在该时间的一定范围，异常的话，做一定的异常处理）

如，当前AAC一帧的播放时间是= 1024*1000000/44100= 22.32ms(单位为ms)

或

当前AAC一帧的播放时间是= 1024/44100 = 0.02232 s(单位为秒)=22.32ms(单位为ms)

反过来，如当想通过音频缓冲多少ms来计算实际应缓冲多少个音频帧时，可下计算：

比如对48K缓冲300ms需要多少个buffer，

buffer = 一秒内能产生多少个音频帧（48000/1024）乘以时间比例（300/1000） = （48000*300）/(1024*1000) = 14.0625个。

2 MP3

mp3 每帧均为1152个字节，则：

frame_duration = 1152 * 1000000 / sample_rate

例如：sample_rate = 44100HZ时，计算出的时长为26.122ms，这就是经常听到的mp3每帧播放时间固定为26ms的由来。

===============================================================================================

音视频流的发送

1 请教大伙
  我只做过 MPEG4视频流的RTP打包传输接收
  现在加入了音频采集所以要发送音视频流
  我想请问大伙在发送时一般的做法是音视频流分开发送
  还是发送音视频的合成流？
答案：

直播考虑实时性的话，就可能要考虑丢视频包、保音频包；分开传输比较好

点播不考虑实时性、要求同步的话，可以进行缓冲；合并传输比较好

现在的话对合成流打包就不需要有什么讲究了吧
在接收端解RTP包在接分解 filter 再分别解压音视频流

GoRustNeverStop

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
计算音频帧的播放时间(音频码流音频帧)

音频码流（冗余数据占的比例）：先简单讲一下对于ADTS header的结构的理解： 1）ADTS header位于每一个aac帧的开头，长度一般是7字节（也可以是9字节的，没见过）。 2）每个aac帧的长度固定为1024个sample（可以是1024*n，没见过n>1的情况）。 3）ADTS header中大部分信息无用，有用的只有采样率(4bit)、声道数(3bi
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。