语音信号处理理论概述

目录

1.短时能量分析

2.短时自相关分析

3.AMDF法提取基音周

4.功率谱估计


       语音信号的分析是语音信号处理的基础和前提,语音通信、语音合成和语音识别这些技术只有在分析出可表示语音信号本质特征的参数,才能利用这些参数进行高效的处理。而且,语音信号分析的准确性和精确性也决定了语音合成的音质好坏。因此,在语音信号处理应用中语音信号分析具有十分重要的地位。

      语音分析中使用到的是“短时时间分析技术”。之所以不能用处理平稳信号的数字信号处理技术对它进行分析,是因为语音信号的属性和特征是随时间变化而变化的,它是一个非平稳态的过程。然而,由于不同的语音由口腔肌肉通过运动产生的声音,口腔肌肉运动的频率相对声音频率反应是很慢的,所以另一方面,虽然声音信号有时变性,但在短期的时间内,它的基本特征保持不变,即是相对稳定的,因此,可以将语音信号看成是一个准稳态过程,即语音信号具有短时平稳特性。所以语音信号的分析和处理一般建立在短时的基础上,进行短时分析,将语音分成多段,每一段为一帧,帧长一般取10-30ms。这样,每一帧的语音信号为稳定的,然后将每一帧的分析结果组成一个整体即为整体的语音信号特征参数。

       语音信号的时域分析是分析和提取语音信号的时域参数。语音分析时,第一次接触到的且也是最直观的是时域波形。语音信号本来就是时域信号,因此时域分析是最早的,也是最广泛使用的分析方法,这种方法是直接使用的语音信号时域波形。通常用于时域分析基本的参数分析,如语音分割,预处理,大型分类。这种分析方法的特点是:(1)表示语音信号更直观,清晰的物理意义。 (2)实施相对简单,运算少。 (3)可以得到一些语音的重要参数。(4)只使用一般的简单设备,如示波器。语音信号时域参数包括短时能量,短时过零率,短时自相关函数和短时平均幅度差函数等等,这是一个基本的短时参数,在各种语音信号处理中都有重要的应用。

1.短时能量分析

       因为语音信号的能量是随时间变化的,清音信号和浊音信号之间的能量差别相当显著。因此,对语音的短时能量进行分析,可以描述语音的这种特征变化情况。定义短时能量为:

      可以理解为:首先语音信号各个样点值平方,然后通过一个冲击响应为h(n)的滤波器,输出为由短时能量构成的时间序列。短时能量的计算直接受冲击响应的选择即窗函数的选择的影响。如果冲击响应的幅度是恒定的,它的序列长度N(即窗长)会很长,将其等效为非常窄的低通滤波器,这时冲击响应对产生的平滑的作用比较明显,使短时能量基本没有很大的变化,将不能表现出语音的时变的特性。相反,如果冲击响应的序列长度过于小,等效窗就不能提供出够用的平滑,以导致语音的振幅在瞬时的变化的许多细节仍被留了下来,进而不能看出振幅包络变化的规律,一般我们要求窗长是几个基音周期的数量级。

短时能量函数的应用:

(1)可用于区分清音段与浊音段。En值大对应于浊音段,En值小对应于清音段。

(2)可用于区分浊音变为清音或清音变为浊音的时间(根据En值的变化趋势)。

(3)对高信噪比的语音信号,也可以用来区分有无语音(语音信号的开始点或终止点)。无信号(或仅有噪声能量)时,En值很小,有语音信号时,能量显著增大。

2.短时自相关分析

对于确定性信号序列,自相关函数定义为:

对于随机性信号序列或周期性信号序列,自相关函数的定义为:

短时自相关函数的定义如下:

        对两图分析可得:清音信号的短时自相关函数的波形不具有周期性,也没有明显的峰值,且随着延时k的增大迅速变小,因此其接近于随机噪声;浊音是具有周期性的信号,浊音信号的周期为自相关函数的周期,由此可知,语音信号的性质是浊音还是清音,如果是浊音,还可以得出它的基音周期,它的基音周期可由自相关函数波形中的第一个峰值的位置来估计。

3.AMDF法提取基音周

      基音提取的方法大致可分为以下三类:①波形估计法。直接由语音波形来估计基音周期,分析出语音波形上的周期峰值。②相关处理法。在语音信号处理中大多使用这种方法,因为这种方法抗波形的相位失真强,另外这种方法在硬件处理上结构简单。③变换法。将语音信号变换到频域或倒谱域来估计基音周期。本文将主要介绍AMDF法提取基音周期。与自相关法相比,AMDF方法具有运算量小、精度高等优点,在语音编码中得到广泛应用。

      传统的平均幅度差函数(Average Magnitude Difference Function ,AMDF) 是由Ross等人于1974提出的 ,其定义为:

      AMDF 法的思想是: 如果信号是一个标准的周期函数, 那么不同基音周期段的对应信号之差为零。浊音是一个准周期语音信号,在一帧长度的语音信号内基音周期接近恒定, 那么在不同基音周期段内,对应信号之差应该很小; 但是清音信号因为它接近于随机噪声所以不具备上述的特点。在AMDF 方法中, 短时平均幅度差函数定义

基音周期:


       与短时自相关函数相比不同点是: AMDF函数进行基音周期估计时是寻找最低谷点的位置,而自相关函数进行基音周期估计时寻找最大峰值点的位置,在同一时间,AMDF函数的谷值是比自相关的高峰值更加尖锐的,所以误判率比自相关函数较小,其稳定性相对自相关函数较高。当语音信号为清音时,AMDF函数没有明显的波谷值。

4.功率谱估计

       功率谱估计技术已经有很长的历史了,近几十年来又得到了快速的发展,功率谱估计的内容和方法不断更新变换。通常的,功率谱估计方法可分为两种:现代谱估计法和经典谱估计法。而经典谱估计法又可分为两种:直接法与间接法;现代谱估计大致分为AR模型参数法、MUSIC法、MTM法、还有特征向量法等。

       直接法又称为周期图法,是由舒斯特在1898年提出。直接法是直接由傅里叶变换得到:

      间接法,又称之为自相关法,是由布来拉克曼与图基在1958年首先提出的。

下图为用间接法对一语音信号的功率谱估计。

      现在比较常用的改进方法是Welch法,又叫加权交叠平均法,这种方法以加窗(加权)求取平滑,以分段重叠求得平均,因此集平均与平滑的优点于一体,同时也不可避免带有两者的缺点,因此归根到底是一种折中。

  • 15
    点赞
  • 28
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

fpga和matlab

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值