WAVE音频文件数字信号处理——实现变声功能

  1. WAVE音频文件

       WAVE文件作为最早的数字音频文件格式之一,是应用于windows平台的波形音频文件。它是一种无损的音频文件,具有较好音质,缺点是占用大量存储空间。之后WAVE文件从无压缩编码形式PCM(脉冲编码调制)发展到压缩形式的编码解决其弊端,其中压缩格式有微软的自适应差分脉冲编码调制,国际电报联盟制定的语音压缩标准ITU G.711 a-alaw、GSM 6.10、ITU G7.721 ADPCM等。该文件遵循RIFF(Resource InterChange File Format)文件格式存放信息,它把WAVE文件划分为文件头和数据两个部分,并以小端方式存储数据,其中文件头包含音频信号的信息,存储及编码格式信息,如采样频率、数据存放大小、声道数目等信息。文件的扩展名标识文件数据类型。RIFF文件是以块作为基本单位,以树类型作为存储结构去存储文件数据。每个块包含文件表示符ID,当前块区间的大小和块数据内容,其中块大小为去除标识符字节占用空间和存储块长度占用空间后大小。RIFF格式结构的树根结点部是以“RIFF”为标识,叶子结点部分有“data”(数据块)标识,“fmt”(格式块)标识,若WAVE文件被压缩,还包括“fact”标识,该标识块记录了非PCM编码即压缩格式编码下文件的相关信息[2]。具体WAVE文件格式说明如表所示。


       常见的音频压缩方法有帧间压缩和帧内压缩,在此基础上编码有对称编码和非对称编码两种方式。由于帧间压缩考虑了两帧数据间的重复量,所以可以达到帧内压缩达不到的压缩比,常用算法有幅差值算法等。对称编码数据处理速度快相比非对称编码更适用于实时音频信号传输处理的场合。

如还是不懂请看:点击打开链接

2. 音频处理

1.重采样原理及其分析

上采样:上采样就是通过插值的方法实现,下采样是通过抽取离散的音频信号实现。如下进行P倍的上采样分析,其中y为上采样                后的结果,x为未处理前的离散信号。在x的每个离散信号间插入P-1个零点。


评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值