1s采样的多少bit数据:采样率 * 声道 * 位深
采样率:1s采样频次 比如:8KHz,1秒采样8000次(1次是指在音频模拟波中取一个点),因此采样率越高,可以使音频模拟波跟接近,因此音质也会更逼真
声道:双声道或单声道
位深:描述的是一个采样点几个bit位表示 (简单来说:就是表示这一个点的振幅数值信息),因此位深值越大,可以跟精确的模拟声波
下面为一些数据计算,辅助理解音频应用概念:
一帧音频有多少bit数据:每帧采样点数 * 位深
1s有多少帧数据: 采样率 * 声道 * 位深 / 每帧采样点数 * 位深
1帧所播放的时长:1s / 1s有多少帧数据
采样一个点的时间:1帧所播放的时长 / 每帧采样点数
重采样:重采样是一种统计学方法,用于调整或转换数据集的采样频率。在重采样过程中,旧的观测值被重新组合或替换为新的观测值,以适应新的采样频率或数据需求。
比如:8K 单声道 位深:16
1s采样数据 = 8000 * 1 * (16 / 8) = 16000(字节)
假设每帧采样点数:320
一帧音频数据 = 320 * (16 / 8) = 640(字节)
1s有多少帧音频数据 = 16000 / 640 = 25 帧
1帧所播放的时长 = 1s / 25 = 40 ms
采样一个点的时间 = 40 ms / 320 = 125us
比如:16K 单声道 位深:16
1s采样数据 = 16000 * 1 * (16 / 8 )= 32000(字节)
假设每帧采样点数:320
一帧音频数据 = 320 * (16 / 8) = 640(字节)
1s有多少帧音频数据 = 32000 / 640 = 50帧
1帧所播放的时长 = 1s / 50 = 20ms
采样一个点的时间 = 20 ms / 320 = 62us
16K重采样为8K,为保证和8k播放时间一样,每帧采样点数减半
每帧采样点数:160
一帧音频数据 = 160 * (16 / 8) = 320(字节)
1s有多少帧音频数据:16000 / 320 = 50帧
1帧所播放的时长 = 1s / 50 = 20ms
采样一个点的时间 = 20 ms / 160= 125us
8K重采样为16K,为保证和16k播放时间一样,每帧采样点数扩增2倍 每帧采样点数:640
一帧音频数据 = 640 * (16 / 8) = 1280(字节)
1s有多少帧音频数据:16000 * (16 / 8) / 1280 = 25 帧
1帧所播放的时长 = 1s / 25 = 40 ms
采样一个点的时间 = 40 ms / 640 = 62us
因为重采样是将原始采样率下的音频信号转换为目标采样率下的音频信号。当将8K的音频信号重采样为16K时,目标采样率是比原始采样率高的,所以每秒钟需要更多的采样点来表示音频信号。为了保持音频的持续时间不变,每帧采样点数需要减少,以便在目标采样率下保持相同的音频长度。