语音信号处理(一)——语音的产生和感知(上)

引言

语音中最小的基本单位是音素。由音素构成音节,又由音节构成不同的词或单词。音素是人类能区别一个单词和另一个单词的基础。音素分为元音和辅音两类。
汉语不同于大部分的西方语言。汉语的语音分析总是把一个汉语音节分为声母和韵母两部分:声母是指一个汉语音节开头的辅音,它们比较简单,只是一个音素;而韵母则比较复杂,它们是汉字音节除了开头的声母以外的部分。汉语中有21个声母和39个韵母。
汉语的特点是:汉语的自然单位为音节,每一个字都是单音节字。即汉语的一个音节就是汉语一个字的音,这里所指的“字”是一个独立发音的单位,再由音节字构成词(主要是两音节字构成的词),而每一个音节字又都是有声母和韵母拼音二乘;最后再由词构成句子。
汉语语音的另一个重要特点是其具有声调(即音调在发一个音节中的变化),这样使用汉语较其他语音更为经济。声调是一种音节在念法上的高低升降变化。汉语有四种声调,即阴平(一声)、阳平(二声)、上声(三声)、去声(四声)。由于有声调之分,所以参与拼音的韵母又有若干种(包括轻声在内至多有5种)声调。

1.1 发声器官

人体的发音器官由三部分组成:肺和气管、喉、声道。
声带每开启和闭合一次的时间就是声带振动的周期,也就是音调周期或基音周期;它的倒数称为基音频率,简称为基音。基音决定了声音频率的高低,频率高则音调高,频率低则音调低。基音的范围为60-500Hz。

1.2 语音信号的数字模型

表示采样语音信号的离散模型是特别重要的。建立模型的目的是要寻求一种可以表达一定物理状态下的数学关系,而且要使这种关系不仅具有最大的精确度,还要最简单。
语音信号是一连串的时变过程。声门和声道相互耦合,形成了语音信号的非线性特性。然而,在做出一些合理的假设、在较短的时间间隔内表示语音信号时,可以采用线性时不变模型。
下面是经典的语音信号数字模型,这里语音信号被看成是线性时不变系统(声道)在随机噪声或准周期脉冲序列激励下输出。
长期研究证实,发不同性质的音时,激励的情况时不同的。大致分为两大类:发浊音时,气流通过绷紧的声带,冲激声带产生振动,使声门处形成准周期的脉冲串,并用它去激励声道;发清音时,声带松弛而不振动,气流通过声门直接进入声道。
语音信号产生的时域模型:
语音信号产生的时域模型

1.2.1 激励模型

发浊音时,由于声带不断开启和关闭,将产生间歇的脉冲波。根据测量结果,这个脉冲波类似于斜三角的脉冲,如下图1-2-2(a)。因此,此时的激励信号是一个以基音周期为周期的斜三角脉冲串。单个斜三角波形的数学表达式为:
在这里插入图片描述
式子中, N 1 N_1 N1是斜三角波上升部分的时间; N 2 N_2 N2为三角波下降部分的时间。单个斜三角波形的频谱 G ( e j w ) G(e^{jw}) G(ejw)如图1-2-2(b)。由图可见,它是一个低通滤波器,通常更希望将其表示为 Z Z Z变换的全极点模型形式: 1 ( ( 1 − e − C T z − 1 ) 2 \frac{1}{((1-e^{-CT}z^{-1})^2} ((1eCTz1)21
式中,C是一个常数。
显然斜三角波可以被描述为一个二极点的模型。
因此,斜三角波脉冲串可被看做加权的单位脉冲串激励上述单个斜三角波模型的结果。而该单位脉冲串及幅值因子可表示成下面的z变换形式:
A v 1 − z − 1 \frac{A_v}{1-z^{-1}} 1z1Av
所以整个激励模型可以表示为:
U ( z ) = G ( z ) E ( z ) = U(z)=G(z)E(z)= U(z)=G(z)E(z)= A v 1 − z − 1 \frac{A_v}{1-z^{-1}} 1z1Av ∗ * 1 ( ( 1 − e − C T z − 1 ) 2 \frac{1}{((1-e^{-CT}z^{-1})^2} ((1eCTz1)21
另一种是发清音的情况,这是声道被阻碍形成湍流,所以可模拟成随机白噪声,实际上,可以使用均值为0,方差为1,并在时间或者幅度上为均匀分布的序列。
在这里插入图片描述

应该指出,这样简单的把激励分为清音和浊音时不严谨的,对于某些音,即使是把两种激励简单地叠加起来也是不合适的。但是,若将这两种激励源经过适当的网络后,是可以得到良好的激励信号的。为了更好地模拟激励信号,有人提出在一个音调周期时间内用多个斜三角波脉冲的方法。

参考文献

宋知用. MATLAB语音信号分析与合成(第2版). 北京航空航天大学出版社,2018.

  • 3
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值