语音信号处理的一些基础知识

人耳的听觉掩蔽效应

一般人可以感觉到20Hz-20kHz,强度为5dB-130dB。
人耳的掩蔽效应:在一个强信号附近,弱信号将变得不可闻,被掩蔽掉了。被掩蔽的不可闻信号的最大声压级称为掩蔽门限或者掩蔽阈值

一个1KHz的掩蔽声的掩蔽曲线

语音信号生成的模型

理想的模型是线性时不变的,但是语音信号是非平稳的随机过程,其特征是随着时间变化的,所以模型的参数也是随着时间变化的。但是语音信号随着时间变化是缓慢的,所以可以做一些合理的假设,将语音信号分为一些相继的短段进行处理,在这些段中我们可以认为语音信号特征是不随着时间变化的平稳随机过程。这样在这些短暂时间内表示的语音信号,可以采用线性时不变模型来分析。也被称为“短时分析技术”。

语音信号被看成是线性时不变系统(声道)在随机噪声或准周期脉冲序列激励下的输出。其生成的数学模型可由三部分共同作用在声波上产生:

  • 声门产生的激励模型G(z)——激励系统
  • 声道产生的调制函数V(z)——声道系统
  • 嘴唇产生的辐射函数R(z)——辐射系统

语音信号的传递有这三个函数级联而成:
在这里插入图片描述

激励模型

  • 2
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值