关于 Wave 文件的基础知识与文件格式

Wave 文件的基础知识

经常见到这样的描述: 44100HZ 16bit stereo 或者 22050HZ 8bit mono 等等.

44100HZ 16bit stereo : 每秒钟有 44100 次采样, 采样数据用 16 位(2字节)记录, 双声道(立体声);
22050HZ 8bit mono : 每秒钟有 22050 次采样, 采样数据用 8 位(1字节)记录, 单声道;

当然也可以有 16bit 的单声道或 8bit 的立体声, 等等.

人对频率的识别范围是 20HZ - 20000HZ, 如果每秒钟能对声音做 20000 个采样, 回放时就足可以满足人耳的需求. 所以 22050 的采样频率是常用的, 44100 已是 CD 音质, 超过 48000 的采样对人耳已经没有意义. 这和电影的每秒 24 帧图片的道理差不多.

每个采样数据记录的是振幅, 采样精度取决于储存空间的大小:
1 字节(也就是8bit) 只能记录 256 个数, 也就是只能对振幅做 256 种识别;
2 字节(也就是16bit) 可以细到 65536 个数, 这已是 CD 标准了;
4 字节(也就是32bit) 能把振幅细化到 4294967296 种可能性, 实在是没必要了.

如果是双声道(stereo), 采样就是双份的, 文件也差不多要大一倍.

这样我们就可以根据一个 wav 文件的大小、采样频率和采样大小估算出一个 wav 文件的长度; 譬如 "Windows XP 启动.wav" 的文件长度是 424,644 字节, 它是 "22050HZ / 16bit / 立体声" 格式(这可以从其 "属性->摘要" 里看到).
它的每秒的传输速率是 22050*16*2 = 705600(bit), 换算成字节是 705600/8 = 88200(字节);
424644(总字节数) / 88200(每秒字节数) ≈ 4.8145578(秒).

这还不够精确, 在标准的 PCM 格式的 WAVE 文件中还有 44 个字节是采样数据之外的内容, 应该去掉:
(424644-44) / (22050*16*2/8) ≈ 4.8140589(秒). 这比较精确了.

关于声音文件还有一个概念: "位速", 也有叫做比特率、取样率, 譬如上面文件的位速是 705.6kbps 或 705600bps, 其中的 b 是 bit, ps 是每秒的意思; 压缩的音频文件常常用位速来表示, 譬如达到 CD 音质的 mp3 是: 128kbps / 44100HZ.

Wave 文件的文件格式

微软的多媒体文件(wav、avi、tif 等)都有一个 RIFF 头, Wave 文件基本是这个样子:

RIFF 头
  fmt 子块
data 子块


Wave 文件的编码方式有好多, 最常用最简单的就是 PCM 编码.

其他编码会包含更多的"块", 但至少会包含上面的块, PCM 编码只包含上面的块.

下面是 PCM 编码的祥表:

RIFF 头 ckid 4 "RIFF" 标识
cksize 4 文件大小; 这个大小不包括 ckid 和 cksize 本身, 下面的子块大小也是这样
fccType 4 类型, 这里是 "WAVE" 标识
    24 fmt 子块 ckid 4 "fmt " 标识
cksize 4 块大小;  PCM 编码这里是 16, 其他编码也不小于 16
wFormatTag 2 编码格式; 1 表示是 PCM 编码 
nChannels 2 声道数; 1 是单声道、2 是立体声
nSamplesPerSec 4 采样频率(每秒的样本数); 譬如 44100
nAvgBytesPerSec 4 传输速率 = 采样频率 * 每次采样大小, 单位是字节
nBlockAlign 2 每次采样的大小 = 采样精度 * 声道数 / 8(因单位是字节所以要/8);
这也是字节对齐的最小单位, 譬如 16bit 立体声在这里的值是 4 字节
wBitsPerSample 2 采样精度; 譬如 16bit 在这里的值就是 16
  ? data 子块 ckid 4 "data标识
cksize 4 块大小
采样数据 ? 双声道数据排列: 左右左右...; 8bit: 0-255, 16bit: -32768-32767


其他编码可能会包含的块有: 事实块(Fact)、提示块(Cue)、标签块(Label)、注释块(Note)、标签文本块(Labeled Text)、采样器块(Sampler)、乐器块(Instrument)、列表块(List)等等, 如果有 List 块, 它还会包含更多子块. 



判断文件是否为Wave格式

Wave 文件的前 12 个字节可以这样描述:


TRiff = record
  ckId    : DWORD; {'RIFF'}
  ckSize  : DWORD; {文件大小, 不包括前 8 个字节}
  fccType : DWORD; {'WAVE'}
end;

  
  

我们读出文件的前 12 个字节进行判断, 就基本可以确认它是不是 Wave 文件.


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值