语音信号的产生模型

 1.语音的产生

       a.有声激励:声门关闭。气流迫使声门周期的打开和关闭产生浊音或一些元音。该周期的倒数为“基音频率”(fundamental frequency),该频率在80Hz-350Hz。

         b.无声激励:声门打开并且穿过嘴的一个小的空间,该过程产生清音,如同噪声信号,该信号的频谱由该小空间所处的位置。

         c.瞬时激励: 嘴中的气流压在嘴突然打开空气流瞬间冲出产生爆破音。

       注:还有其他的一些语音是以上三种激励的组合。语音信号谱的形状由声道形状决定(舌头的位置,牙齿,嘴唇)。

   2.语音信号的特点

         语音信号有如下特点:

                a.信号的带宽为4KHZ    b.语音信号的基音频率范围是80Hz~350Hz     c.在如下能量谱范围内出现峰值

(2n − 1) ∗ 500 Hz ; n = 1, 2, 3, . . . 

                     d.信号的功率谱包络随着频率的增加呈现下降的趋势。

                     注明:其实语音信号的带宽要大于上面说的4KHz,例如一些摩擦音也是频谱能量中重要的高频成分,但是对于电话,平常说话时候的语音,带宽为4KHZ完全包含了人们理解内容的必要信息。还有在上面提到的频谱峰值就是共振峰。共振峰的改变由声道的形状决定。

    3.一个简单的语音产生模型

   

 语音产生的过程包括三部分:激励模型,声道模型以及辐射模型。

语音信号的频谱为:

R(f)为辐射模型。

 

在模型中,影响语音信号的主要参数如下:

•the mixture between voiced and unvoiced excitation (determined by v and u)
• the fundamental frequency (determined by P(f))
• the spectral shaping (determined by H(f))
• the signal amplitude (depending on v and u)

在语音识别中,需要对语音进行分析,提取语音信号中最重要的信息。

the most valuable information is contained in the way the spectral shape of the speech signal changes in time. To reflect these dynamic changes, the spectral shape is determined in short intervals of time, e.g., every 10 ms.By directly computing
the spectrum of the speech signal, the fundamental frequency would be implicitly contained in the measured spectrum。下图为一个元音的对数功率谱图:

                   元音 /a:/ (采样频率fs = 11kHz, 长度length = 100ms).

   上面的时间信号波峰是由有声激励的P(f)引起的。 我们可以通过带通滤波器来观察该信号的频谱形状,平滑滤波器的输出,每个滤波器的输出代表该频带范围的能量。

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值