简述
在 Qt 之 WAV文件解析 中给出了WAV文件属性的计算,具体包括文件大小、音频时长、比特率等属性,这里我们再次验证一下这些属性值的计算 。
在计算之前,我们要知道一下wav文件中的三个参数 采样频率、音频通道数、每次采样得到的样本位数 ,这三个参数用来表示声音,同时决定了wav文件的音质,大小。下面简单介绍一下这三个参数。
采样频率
指每秒钟取得声音样本的次数。采样的过程就是抽取某点的频率值,很显然,在一秒中内抽取的点越多,获取得频率信息更丰富,为了复原波形,采样频率越高,声音的质量也就越好,声音的还原也就越真实,但同时它占的资源比较多。由于人耳的分辨率很有限,太高的频率并不能分辨出来。22050 的采样频率是常用的,44100已是CD音质,超过48000或96000的采样对人耳已经没有意义。
音频通道数
声音的通道的数目。常见的单声道和立体声(双声道),现在发展到了四声环绕(四声道)和5.1声道。如果是双声道,采样就是双份的,文件也差不多要大一倍。
每次采样得到的样本位数
采样位数可以理解为声卡处理声音的解析度。这个数值越大,解析度就越高,录制和回放的声音就越真实。 采样位数也叫采样大小或量化位数。它是用来衡量声音波动变化的一个参数,也就是声卡的分辨率或可以理解为声卡处理声音的解析度。它的数值越大,分辨率也就越高,录制和回放的声音就越真实。
计算公式
波形数据传输速率(每秒平均字节数) = 采样频率 × 音频通道数 × 每次采样得到的样本位数 / 8
比特率(kbs) = 波形数据传输速率 × 8 / 1000
WAV文件所占大小(字节) = 波形数据传输速率 × 音频文件时长
音频文件时长(秒) = WAV文件所占容量 / 波形数据传输速率
关于以上几个属性我们可以右击wav文件查看文件属性看到这几个值。见下图。
从上述两幅图中我们可以知道这个wav文件的总大小为6947字节,比特率为88kbs,时间为0s,是不是很诧异,为什么这里时间为0呢?实际上windows这里只是按整数显示了音频时长,那么真正的时间怎么计算呢?
这里我们已经知道了wav文件的大小,看上述公式,我们还要知道波形数据传输速率,波形数据传输速率而又是由采样频率 、 音频通道数 、 每次采样得到的样本位数 来决定,那么这些参数怎么获取到呢?
看过Qt 之 解析wav文件的头信息(详细分析、对比不同wav文件的数据)这篇文章就应该知道如何去解析一个wav文件,并获取所有的文件头信息,如果不知道文件头信息是什么,请参考Qt 之 WAV文件解析。
好了,既然对于一个wav文件,我们能够获取到所有的头信息,那么接下来就来验证以上公式计算的结果。
上图为wav文件的头信息数据,我们可以看到波形数据传输速率(nBytesPerSecond)的值为11025,文件总大小为6947字节,音频数据大小为6903字节,文件头信息为44字节。
音频文件时长(秒) = WAV文件所占容量 / 波形数据传输速率 = 6903 / 11025 = 0.626122 s
比特率(kbs) = 波形数据传输速率 × 8 / 1000 = 11025 × 8 / 1000 = 88 kbs
这里为什么精确到小数点后六位,其实也是为了与程序记录的时间做对比,这里也要特别注意:实际上 WAV文件所占容量 为 WAV文件中 音频数据大小 ,而并非WAV文件总大小 , 但是 文件头信息所占字节非常小,所以就算是将这块大小加上进行计算,对最后的计算结果影响也非常小。下面我们就用QAudioOutput 来播放这个wav文件,同时记录播放时间 。
代码之路
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
- 11
- 12
- 13
- 14
- 15
- 16
- 17
- 18
- 19
- 20
- 21
- 22
- 23
- 24
- 25
- 26
- 27
- 28
- 29
- 30
- 31
- 32
- 33
- 34
- 35
- 36
- 37
- 38
- 39
- 40
- 41
- 42
- 43
- 44
- 45
- 46
- 47
- 48
- 49
- 50
- 51
- 52
- 53
- 54
- 55
- 56
- 57
- 58
- 59
- 60
- 61
- 62
- 63
- 64
代码中我分别用了QAudioOutput类的elapsedUSecs方法和QTime类的elapsed方法来记录wav文件音频时长。以下是两个方法的介绍。
elapsedUSecs() 输出为微妙
elapsed() 输出为毫秒
通过记录得到以下数据:
m_audioOutput->elapsedUSecs() : 636000
m_time.elapsed() : 635m_audioOutput->elapsedUSecs() : 639000
m_time.elapsed() : 638m_audioOutput->elapsedUSecs() : 642000
m_time.elapsed() : 641m_audioOutput->elapsedUSecs() : 639000
m_time.elapsed() : 639
而我们的计算结果为: 0.626122 s = 626.122 ms = 626122 us , 显然程序中获取的时间大于计算的时间,这也很好理解,因为程序的运行需要消耗一定的时间,所以记录的时间存在很小的误差(误差范围大致在0.009s ~ 0.016s),如果电脑性能更好这个误差就越小。
特别注意
这里我们用QAudioOutput类来计算wav文件时长,这里我们要给QAudioOutput类对象设置播放格式QAudioFormat ,设置的格式必须与解析出来的文件头信息中的 采样频率、音频通道数、每次采样得到的样本位数、编码格式等严格保持一致,否则不仅播放出来的声音不清楚,记录的音频时长也有问题。
尾
通过以上发现,我们的计算公式是成立的。基本上我们可以在wav文件头信息中获取wav文件的全部信息,唯一就是wav**文件时长**需要通过文件头中的信息进行计算得到。所以如果我们想要做一个播放器,在播放器上显示一个wav文件的时长,我们就需要先解析wav文件的头信息,通过计算得到文件时长。