如何用Vc读wav 格式的文件

12 篇文章 0 订阅
1.1 RIFF文件和 WAV文件 格式

在Windows环境下,大部分的多媒体文件都依循着一种结构来存放信息,这种结构称为"资源互换文件 格式"(Resources lnterchange File Format),简称RIFF。例如声音的 WAV文件、视频的AV1文件等等均是由此结构衍生出来的。RIFF可以看做是一种树状结构,其基本构成单位为chunk,犹如树状结构中的节点,每个chunk由"辨别码"、"数据大小"及"数据"所组成。
辨别码由4个ASCII码所构成,数据大小则标示出紧跟其后数据的长度(单位为Byte),而数据大小本身也用掉4个Byte,所以事实上一个chunk的长度为数据大小加8。一般而言,chunk本身并不允许内部再包含chunk,但有两种例外,分别为以"RIFF"及"L1ST"为辨别码的chunk。而针对此两种chunk,RIFF又从原先的"数据"中切出4个Byte。 此4个Byte称为" 格式辨别码",然而RIFF又规定文件中仅能有一个以"RIFF"为辨别码的chunk。

只要依循此一结构的文件,我们均称之为RIFF档。此种结构提供了一种系统化的分类。如果和MS一DOS文件系统作比较,"RIFF"chunk就好比是一台硬盘的根目录,其 格式辨别码便是此硬盘的逻辑代码(C:或D:),而"L1ST"chunk即为其下的子目录,其他的chunk则为一般的文件。至于在RIFF文件的处理方面,微软提供了相关的函数。视窗下的各种多媒体文件 格式就如同在磁盘机下规定仅能放怎样的目录,而在该目录下仅能放何种数据。

WAV为WAVEFORM(波形)的缩写。声音文件的结构如图1所示,"RIFF"的 格式辨别码为"WAVE"。整个文件由两个chunk所组成:辨别码"fmt"(注意,最后一个是空白字符!)及"data"。

在"fmt"的chunk下包含了一个PCMWAVEFORMAT数据结构,其定义如下:

typedef struct pcmwaveformat - tag {

WAVEFORMAT wf ;

WORD wBitsPerSample;

} PCMWAVEFORMAT;

typedef struct waveformat - tag {

WORD wFormatTag ;

WORD nChannels;

DWORD nSamplesPerSec;

DWORD nAvgBytesperSec;

WORD nBlockAlign;

} WAVEFORMAT;

其意义分别为:

wFormatTag:记录着此声音的 格式代号,例如WAVE_FORMAT_PCM,WAVE_F0RAM_ADPCM等等。

nChannels:记录声音的频道数。
nSamp1esPerSec:记录每秒取样数。

nAvgBytesPerSec:记录每秒的数据量。

nBlockA1ign:记录区块的对齐单位。
>
> wBitsPerSample:记录每个取样所需的位元数。
>
> "data"Chunk包含真正的声音数据。Window目前仅提供WAVE_FORMAT_PCM一种数据 格式,所代表的意义是脉派编码调变(Pu1se Code Modulation)。针对此 格式,Windows定义了在"data"的chunk中数据的存放情形,图2中列出了四种不同频道数及取样所需的位元数以及位元位置的安排。
>
> "RIFF" 频道0 频道0 频道0 频道0
>
> xxxx nChannels=1,wBitsPerSample=8
>
> "WAVE" 频0(左) 频道1(右) 频道0(左) 频道1 (右)
>
> "fmt "
>
> nChannels=2,wBitsPerSample=8
>
> sizeof(PCMWAVEFORMAT)
>
> struct of PCMWAVEFORMAT 频道0(低位) 频道0(高位) 频道0(低位)频道0(高位)
>
> "data" nChannels=1,wBitsPerSample=16
>
> xxxx 频道0(低位) 频道0(高位) 频道0(低位)频道0(高位)
>
> (低位) (高位) (低位) (高位)
>
> wave form data
>
> nChannels=2,wBitsPerSample=16
>
> 图1 WAV文件结构 图2 PCM文件中位元安排方式
>
> 第一排表示单声道8位元,第二排表示双声道8位元,第三排表示单声道16位元,第四排表示双声道16位元。8位元代表音量大小由8个位元所表示,16位元则代表音量大小由16个位元所表示。理论上8位元可以表示0~255,16位元可表示0~65536,不过windows却定16位元其值的范围从-32168~32167。此外尚有一点要注意的是,0并不一定代表无声,而是由中间的数值来决定,也就是在8位元时为128,16位元时为0才是无声。所以,若程序设计时需放入无声的数据,糯特别注意声音 格式是16或是8位元,以放入适当的值。
>
> 1.2 WAV文件信息的具体应用
>
> WAV文件中包括了对原始声音的高速率采样,并且以WAVE_PCM_FORMAT脉派编码调变 格式,我们可以在VISUAL C++程序中实现,在读出WAVEHDR文件头之后,下面就是原始声音的高速率采样信息,我们可以对它作多方面的信息处理。
参考资料: http://www.itepub.com/html/kaifawendang/caozuoxitong/Linux/bianchengkaifa/2006/0501/14718.html 
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值