Qt 之 WAV文件属性计算（比特率、文件大小、文件时长）

最新推荐文章于 2025-03-03 18:23:43 发布

亭台六七座

最新推荐文章于 2025-03-03 18:23:43 发布

阅读量5.8k

点赞数 1

分类专栏： Qt-音视频文章标签： Qt音视频 WAV文件解析

Qt-音视频专栏收录该内容

30 篇文章

订阅专栏

简述

在 Qt 之 WAV文件解析中给出了WAV文件属性的计算，具体包括文件大小、音频时长、比特率等属性，这里我们再次验证一下这些属性值的计算。

在计算之前，我们要知道一下wav文件中的三个参数采样频率、音频通道数、每次采样得到的样本位数，这三个参数用来表示声音，同时决定了wav文件的音质，大小。下面简单介绍一下这三个参数。

采样频率

指每秒钟取得声音样本的次数。采样的过程就是抽取某点的频率值，很显然，在一秒中内抽取的点越多，获取得频率信息更丰富，为了复原波形，采样频率越高，声音的质量也就越好，声音的还原也就越真实，但同时它占的资源比较多。由于人耳的分辨率很有限，太高的频率并不能分辨出来。22050 的采样频率是常用的，44100已是CD音质，超过48000或96000的采样对人耳已经没有意义。

音频通道数

声音的通道的数目。常见的单声道和立体声（双声道），现在发展到了四声环绕（四声道）和5.1声道。如果是双声道，采样就是双份的，文件也差不多要大一倍。

每次采样得到的样本位数

采样位数可以理解为声卡处理声音的解析度。这个数值越大，解析度就越高，录制和回放的声音就越真实。采样位数也叫采样大小或量化位数。它是用来衡量声音波动变化的一个参数，也就是声卡的分辨率或可以理解为声卡处理声音的解析度。它的数值越大，分辨率也就越高，录制和回放的声音就越真实。

计算公式

波形数据传输速率（每秒平均字节数） = 采样频率 × 音频通道数 × 每次采样得到的样本位数 / 8

比特率（kbs） = 波形数据传输速率 × 8 / 1000

WAV文件所占大小（字节) = 波形数据传输速率 × 音频文件时长

音频文件时长（秒） = WAV文件所占容量 / 波形数据传输速率

关于以上几个属性我们可以右击wav文件查看文件属性看到这几个值。见下图。

这里写图片描述

从上述两幅图中我们可以知道这个wav文件的总大小为6947字节，比特率为88kbs，时间为0s，是不是很诧异，为什么这里时间为0呢？实际上windows这里只是按整数显示了音频时长，那么真正的时间怎么计算呢？

这里我们已经知道了wav文件的大小，看上述公式，我们还要知道波形数据传输速率，波形数据传输速率而又是由采样频率、音频通道数、每次采样得到的样本位数来决定，那么这些参数怎么获取到呢？

看过Qt 之解析wav文件的头信息（详细分析、对比不同wav文件的数据）这篇文章就应该知道如何去解析一个wav文件，并获取所有的文件头信息，如果不知道文件头信息是什么，请参考Qt 之 WAV文件解析。

好了，既然对于一个wav文件，我们能够获取到所有的头信息，那么接下来就来验证以上公式计算的结果。

这里写图片描述

上图为wav文件的头信息数据，我们可以看到波形数据传输速率（nBytesPerSecond）的值为11025，文件总大小为6947字节，音频数据大小为6903字节，文件头信息为44字节。

音频文件时长（秒） = WAV文件所占容量 / 波形数据传输速率 = 6903 / 11025 = 0.626122 s

比特率（kbs） = 波形数据传输速率 × 8 / 1000 = 11025 × 8 / 1000 = 88 kbs

这里为什么精确到小数点后六位，其实也是为了与程序记录的时间做对比，这里也要特别注意：实际上 WAV文件所占容量为 WAV文件中音频数据大小，而并非WAV文件总大小，但是文件头信息所占字节非常小，所以就算是将这块大小加上进行计算，对最后的计算结果影响也非常小。下面我们就用QAudioOutput 来播放这个wav文件，同时记录播放时间。

代码之路

// 播放wav文件
void MyAudioInput::onPlay()
{
    sourceFile.setFileName(WAV_RECORD_FILENAME);
    sourceFile.open(QIODevice::ReadOnly);

    // 设置播放音频格式;
    QAudioFormat format;
    format.setSampleRate(11025);
    format.setChannelCount(1);
    format.setSampleSize(8);
    format.setCodec("audio/pcm");
    // wav文件即按照这个字节存储顺序保存数据;
    format.setByteOrder(QAudioFormat::LittleEndian);
    format.setSampleType(QAudioFormat::UnSignedInt);

    QAudioDeviceInfo info(QAudioDeviceInfo::defaultOutputDevice());
    //qDebug() << info.supportedCodecs();
    if (!info.isFormatSupported(format))
    {
        qWarning() << "Raw audio format not supported by backend, cannot play audio.";
        return;
    }

    m_audioOutput = new QAudioOutput(format, this);
    connect(m_audioOutput, SIGNAL(stateChanged(QAudio::State)), this, SLOT(handleStateChanged(QAudio::State)));
    m_audioOutput->start(&sourceFile);
    m_time.start();
}

// 播放状态更新;
void MyAudioInput::handleStateChanged(QAudio::State state)
{
    switch (state) {
    case QAudio::IdleState:
        // Finished playing (no more data)
        qDebug() << "elapsedUSecs:" << m_audioOutput->elapsedUSecs();
        qDebug() << "time : " << m_time.elapsed();
        onStopPlay();
        break;

    case QAudio::StoppedState:
        // Stopped for other reasons
        if (m_audioOutput->error() != QAudio::NoError) {
            // Error handling
        }
        break;

    default:
        break;
    }
}
// 关闭播放;
void MyAudioInput::onStopPlay()
{
    if (m_audioOutput != NULL)
    {
        m_audioOutput->stop();
        sourceFile.close();
        delete m_audioOutput;
        m_audioOutput = NULL;
    }
}

 
 1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64

代码中我分别用了QAudioOutput类的elapsedUSecs方法和QTime类的elapsed方法来记录wav文件音频时长。以下是两个方法的介绍。
这里写图片描述

这里写图片描述
elapsedUSecs() 输出为微妙
elapsed() 输出为毫秒

通过记录得到以下数据：

m_audioOutput->elapsedUSecs() : 636000
m_time.elapsed() : 635

m_audioOutput->elapsedUSecs() : 639000
m_time.elapsed() : 638

m_audioOutput->elapsedUSecs() : 642000
m_time.elapsed() : 641

m_audioOutput->elapsedUSecs() : 639000
m_time.elapsed() : 639

而我们的计算结果为： 0.626122 s = 626.122 ms = 626122 us ，显然程序中获取的时间大于计算的时间，这也很好理解，因为程序的运行需要消耗一定的时间，所以记录的时间存在很小的误差（误差范围大致在0.009s ~ 0.016s），如果电脑性能更好这个误差就越小。

特别注意

这里我们用QAudioOutput类来计算wav文件时长，这里我们要给QAudioOutput类对象设置播放格式QAudioFormat ，设置的格式必须与解析出来的文件头信息中的采样频率、音频通道数、每次采样得到的样本位数、编码格式等严格保持一致，否则不仅播放出来的声音不清楚，记录的音频时长也有问题。