基于MATLAB的简单语音系统处理
摘要:语音数据的有效编码可以提高通信系统的有效性,大大减少存储设备的容量。子带编码是一种常用语音编码技术,子带编码中的子带分解和合成是子带编码中的重要组成部分。本文提出了使用非对称滤波器组实现语音信号的子带分解和合并,常用的平行结构滤波器虽然也可以实现自带的分解,实现对高频成分的压缩,但不如树形结构灵活,树形结构QMFB可以实现多分辨率的信号分解与压缩,同时重建信号失真度很低。
一. 设计方案
一个语音处理系统主要包括语音信号的采集,预处理,语音信号的压缩编码,语音信号的解码,语音信号的增强,最后通过音频输出设备输出。为了能够使采集到的语音信号能够完全恢复出来,一般信号的采样频率都是很高的,例如44100HZ,但是人耳能够识别的声音信号的频率范围在300~3400HZ,高于3400HZ的频率基本对人耳无效,因此可以滤除不予编码,同时在300~3400的频率段也有部分频率段占用很少一部分能量,可以子带分解后用较短的码长编码,以此来降低码率,而对低频部分可以通过抽取,来减少传输和处理的数据量。在接收端可以通过插值恢复出低频信号。
本系统主要实现的关键步骤是针对语音信号的频谱设计与之相适应的树形滤波器组,在信源段首先对音频信号进行预处理滤除多余的频段,然后就是设计信源端得分析滤波器组和信宿段综合滤波器组的设计。
分析滤波器组的设计:将信号经过2通道正交镜像滤波器组和2-抽取器,完成信号的第一次高低分频和抽取,然后将分解出来的低频信号再次通过2通道正交镜像滤波器组和2-抽取器,实现对第一次分解出来的低频信号的高低分频和抽取,这次分解出来的次低频成分就是音频信号的需要传输或者处理的有用信号,然后对分解出来的有用信号的高低频信号分别进行等分辨率的3级抽样的8通道分解,分解出16通道音频信号,这样信宿段的子带分解滤波器组就完成了,将音频信号分解成18通道信号,接下来就可以进行编码,存储或传输等一系列处理。
综合滤波器组的设计:综合滤波器组是分析滤波器组的逆过程,对解码出来的18通道信号中的16通道低频信号经过3级由2-内插器和高通滤波器或者低通滤波器组成的16通道综合滤波器,就将这16通道信号综合成一路低频信号,然后将这一路信号2-内插和低通滤波,然后将次高频信号经过2-内插和高通滤波器,将这两路信号相加合并为一路信号,然后将这一路信号再次通过2-内插和低通滤波器,再将最高频信号进行2-内插和高通滤波器,将这两路信号相加就合成了原来音频信号,这样音频信号就可以送到音频设备.
二.设计原理
1、抽取和内插的基本原理
信号的M-抽取是对原始信号每隔M-1个点取一个点,组成新的采样序列。抽取后的信号频谱发生了变化,输入信号x(n)与M—抽取后的输出信号y(n)在频域上的关系式如下:
Y(ejw)=
从上式可以知道,Y(ejw)是将X(ejw)扩展了M倍,幅度变为原来的1/M,在分别以2pi、4pi、6pi,···,2kpi移位叠加得到的;抽取后可能造成频谱混叠,为了避免抽取后的频谱混叠,信号X(n)的带宽必须限制在【-pi/M,pi/M】。通常情况下可以再抽取器前进行抗混叠滤波,所谓的抗混叠滤波就是在抽取前对信号进行低通滤波,把信号的频带限制在【-pi/M,pi/M】。
信号的内插是信号抽取的逆过程,是在已知信号相邻抽样点之间插入若干个抽样值的点。实际中的做法是在已知抽样序列之间插入若干零值,然后通过低通滤波器,几个实现内插。其实就相当于线性插值。L-内插输入信号x(n)与输出信号的频域关系式:
Y(ejw)=X(ejwL)
从上式我们知道,对信号的L-内插相当于对输入信号频谱的L倍压缩,内插后信号的采样周期变为原来的1/L倍。内插不会造成频谱混叠,不会造成信号信息量的丢失,但会使整个数字信号频率轴插入L-1个原始信号的频谱,称为镜像。因此在插值后我们可以通过一个低通滤波器,来消除内插带来的镜像,恢复出原始信号。
2、滤波器组的基本原理
滤波器组是一组拥有共同输入信号或共同输出信号的一组带通滤波器。(系统框图如下)
M通道滤波器组的系统结构
H0(z) |
H1(z) |
Hm-1(z) |
抽取M |
抽取M |
抽取M |
内插M |
内插M |
内插M |
G0(z) |
G1(z) |
Gm-1(z) |
信号的子带分解是通过树形结构滤波器组来实现。本系统中有一个分析滤波器组实现对输入信号的子带分解,一个综合滤波器组完成信号的重建。一个给定的信号经过分解滤波器组分解,然后编码、传输再通过综合滤波器组实现信号的恢复和重建。但是恢复和重建后的信号并不能与原始信号完全相同,两者之间会产生一定的误差,主要包括:
(1)混叠失真:由抽取和内插产生的混叠和镜像带来的误差所造成的。
(2)幅度失真:由滤波器组幅频特性波纹产生的误差所造成的。
(3)相位失真:由滤波器组的相频特性的非线性产生的误差所造成的。
(4)子带量化误差:由编解码产生的误差,与量化噪声相似。这是一种无法完全消除的误差。
完全重建滤波器组:无混叠失真的滤波器组,同时既无幅度失真,又无相位失真。
本系统所设计的树形结构滤波器组,是由两通道的正交镜像滤波器组通过级联或并联组建而成的。
3.正交镜像滤波器组
两通道正交镜像滤波器组的系统框图如下
X(ejw) |
↑2 |
|