音频相关知识:

1s采样的多少bit数据:采样率 * 声道 * 位深
采样率:1s采样频次  比如:8KHz,1秒采样8000次(1次是指在音频模拟波中取一个点),因此采样率越高,可以使音频模拟波跟接近,因此音质也会更逼真


声道:双声道或单声道


位深:描述的是一个采样点几个bit位表示  (简单来说:就是表示这一个点的振幅数值信息),因此位深值越大,可以跟精确的模拟声波

下面为一些数据计算,辅助理解音频应用概念:
一帧音频有多少bit数据:每帧采样点数 * 位深
1s有多少帧数据: 采样率 * 声道 * 位深  / 每帧采样点数 * 位深
1帧所播放的时长:1s / 1s有多少帧数据
采样一个点的时间:1帧所播放的时长 / 每帧采样点数
重采样:重采样是一种统计学方法,用于调整或转换数据集的采样频率。在重采样过程中,旧的观测值被重新组合或替换为新的观测值,以适应新的采样频率或数据需求。


比如:8K 单声道 位深:16
1s采样数据 = 8000 * 1 * (16  /  8) = 16000(字节)
假设每帧采样点数:320
一帧音频数据 = 320 * (16 / 8) = 640(字节)
1s有多少帧音频数据 = 16000 / 640 = 25 帧
1帧所播放的时长 = 1s / 25  = 40 ms
采样一个点的时间 = 40 ms / 320 = 125us

比如:16K 单声道 位深:16
1s采样数据 = 16000 * 1 * (16  /  8 )= 32000(字节)
假设每帧采样点数:320
一帧音频数据 = 320 * (16 / 8) = 640(字节)
1s有多少帧音频数据 = 32000 / 640 = 50帧
1帧所播放的时长     = 1s / 50  =  20ms
采样一个点的时间  = 20 ms / 320  = 62us

16K重采样为8K,为保证和8k播放时间一样,每帧采样点数减半
每帧采样点数:160
一帧音频数据 = 160 * (16 / 8) = 320(字节)
1s有多少帧音频数据:16000 / 320 = 50帧
1帧所播放的时长     = 1s / 50  =  20ms
采样一个点的时间  = 20 ms / 160= 125us

8K重采样为16K,为保证和16k播放时间一样,每帧采样点数扩增2倍                                                每帧采样点数:640
一帧音频数据 = 640 * (16  / 8) = 1280(字节)
1s有多少帧音频数据:16000  * (16  / 8) / 1280 = 25 帧
1帧所播放的时长 = 1s / 25  = 40 ms
采样一个点的时间 = 40 ms / 640 = 62us

因为重采样是将原始采样率下的音频信号转换为目标采样率下的音频信号。当将8K的音频信号重采样为16K时,目标采样率是比原始采样率高的,所以每秒钟需要更多的采样点来表示音频信号。为了保持音频的持续时间不变,每帧采样点数需要减少,以便在目标采样率下保持相同的音频长度。

  • 3
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值