wav文件格式分析

WAVE文件格式是Microsoft的RIFF规范的一个子集,用于存储数字音频,整个文件就是一个RIFF大块,它的基本形式包括两种块:fmt块,用于描述压缩格式、采样率等基本信息;data块。包含实际样本数据。 

这里写图片描述

  • Wave中的块(chunk)

    Wave文件头遵循标准的RIFF文件格式结构。文件中的前8个字节是标准的RIFF组块头,它具有块ID“RIFF”,并且大小等于文件大小减去标题使用的8个字节。“RIFF”块中的前4个数据字节决定了RIFF块中找到的资源类型。Wave文件总是使用“WAVE”。在RIFF类型出现定义音频波形的所有Wave文件块之后。 
    Wave文件只包含两个,特别是格式化块和数据块。这些是需要描述数字音频样本和样本本身的格式的两个块。虽然官方的Wave文件规范不是必需的,但最好在数据块之前放置格式化块。许多程序期望大块按此顺序存储,并且在从诸如因特网的缓慢的线性源流式传输数字音频时更为明智。如果格式是在数据之后,所有的数据,然后格式将不得不被流式传输,才能正确启动播放。 


  • RIFF标头结构定义
struct RIFF_HEADER
 {
  char szRiffID[4];  // 四个字符'R','I','F','F',像这样的字符是低字节存高位,即地址从低到高依次读出'R','I','F','F'
  DWORD dwRiffSize;//文件总数据量-8字节(即除去开头8字节),像这样的数字是低字节存低位,读数时应从高字节向低字节读,才能正确读出
  char szRiffFormat[4]; //四个字符 'W','A','V','E'
 };
 
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

地址 字节数 数据类型 变量名 内容
00H~03H 4 char szRiffID[4] ‘R”I”F”F’标志
04H~07H 4 DWORD dwRiffSize 文件大小,不包括前8字节
08H~0BH 4 char szRiffFormat[4] ‘W”A”V”E’标志

  • FMT块结构定义 
    先定义一个关于波形文件信息的结构体,再把这个结构体作为FMT块结构体的一个成员。
struct WAVE_FORMAT
 {
  WORD wFormatTag;// 编码方法,PCM编码时为1,其他压缩方法时参见下文中“wav格式支持的压缩方法”
  WORD wChannels;//通道数,1为单声道,2为双声道
  DWORD dwSamplesPerSec;//采样率,即每秒的样本数
  DWORD dwAvgBytesPerSec; //传输速率,每秒字节数=采样率*每个样点字节数(即下面的wBlockAlign)
  WORD wBlockAlign; //每个样点字节数=样本宽度*通道数/8
  WORD wBitsPerSample; //样本宽度,即一个样值用多少位表示,通常为8或16
 };
 
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9

FMT块结构体

 struct FMT_BLOCK
 {
  char  szFmtID[4]; // 'f','m','t',三个字符,最后一个字节为空格
  DWORD  dwFmtSize;//fmt块的字节数(编码方式为pcm时为16,即下面结构体成员的字节数,不为pcm时,为),不包括前8个字节 
  WAVE_FORMAT wavFormat;// 上面那个结构体
 };
 
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
地址 字节数 数据类型 变量名 内容
0CH~0FH 4 char szFmtID[4] ‘f”m”t’标志
10H~13H 4 DWORD dwFmtSize fmt块大小,不包括前8字节(一般为16)
14H~15H 2 WORD wFormatTag 标识文件采用的编码方法
16H~17H 2 WORD wChannels 标识单/双(1/2)声道
18H~1BH 4 DWORD dwSamplesPerSec 采样率
1CH~1FH 4 DWORD dwAvgBytesPerSec 传输速率
20H~21H 2 WORD wBlockAlign 每个样点字节数
22H~23H 2 WORD wBitsPerSample 样本宽度
附加信息(24H~25H) 2 WORD   额外的字节数,即下面2字节的WORD ,当wFormatTag不是pcm时会有这最后两项
附加信息(26H~27H) 2 WORD   每一个data block的采样点数,因为在采用IMA-ADPCM压缩算法data chuck中的数据是以block形式来组织的
  • 可选部分fact chunk 
    当wav文件由某些软件转成,会含有该chunk,结构定义如下:
struct FACT_BLOCK
 {
  char  szFactID[4]; //四个字符 'f','a','c','t'
  DWORD  dwFactSize;
 };
 
 
  • 1
  • 2
  • 3
  • 4
  • 5
  • 1
  • 2
  • 3
  • 4
  • 5
  • Data chunk头结构定义
struct DATA_BLOCK
 {
  char szDataID[4]; // 四个字符'd','a','t','a'
  DWORD dwDataSize;//数据块字节数,不含前8个字节
 };

典型的wave文件格式如下图:


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值