语音信号处理--韩纪庆--笔记2-4

语音信号特征应用:

基音周期估计--基音是指发出浊音时声带振动所引起的周期性。基音周期的提取对汉语语音信号的处理尤为重要--汉语是一种有调语言,基音变化的模式称为声调。根据加窗的短时语音帧来估计基音周期在语音编解码、语音识别、说话人确认及生理缺陷辅助系统等领域都是很重要的一部分。基音检测的问题主要在--声门激励波形并不是一个完全周期的序列,语音头尾并不具有声带振动那样的周期性(并不是完美周期信号,头尾有瑕疵);从语音信号中去除声道影响,仅提取与声带振动有关的声源信息较难(声音进入人耳前经历了声道,信号受其影响且很难消除该影响);浊音段也很难精确确定每个基音周期的开始和结束(不仅不完美周期,周期段还不确定);基音周期变化范围大(周期值不稳定);丰富的谐波分量可能比基波分量还强

基音检测的方法--波形估计、相关处理法、变换法(变换域,同态分析)

几种常见方法:

①自相关法--浊音信号自相关函数在基音周期的整数倍上出现峰值,清音信号自相关函数没有明显峰值。声道响应最影响准确性,检测前需要先预处理--语音信号低幅值部分包含大量共振峰信息。,高幅值部分包含较多的基音信息,因此可以抑制低幅值部分--削减与声道响应有关的波动--中心削波法;或者经过一个线性相位低通滤波器滤除高次谐波分量,这样处理后基本只含第一共振峰以下的基波和谐波。  ps.计算自相关函数的运算量很大,因为涉及到很多乘法且计算机进行乘法计算比较笨。

②短时平均幅度差法--不需要削波或三电平量化,仅有加减法和绝对值,没有乘法(简)

③倒谱法--对语音信号利用倒谱解卷原理可以得出激励序列的倒谱,它有与基音周期相同的周期。语音信号对数频谱包含慢变分量和快变分量,进行一次滤波或IDFT可以实现二者的分离。基音峰值的变换和频谱包络变换的间隔足够大,从而容易识别。 ps.适合无噪语音的基音检测。

④简化逆滤波法--先抽取声道模型参数,对原信号逆滤波,从预测误差中得到声源序列,再用自相关法求得基音周期(简)

无论哪种方法得到的基音周期轨迹不可能与真实情况完全一致--大部分一致,局部段落或区域中会有一个或几个偏离了正常轨迹--野点--去除野点采用各种平滑算法。

共振峰估计:共振峰反映声道谐振特性--信息包含在语音频谱包络中,一般认为谱包络最大值即为共振峰。--存在的问题--虚假峰值、合并峰值(相邻共振峰靠的太近难以分辨)、高音调语音(其谐波间隔比较宽,频谱包络估值提供的样点比较少)。

常用的几种共振峰提取方法:

①基于线性预测  ②倒谱法

  • 10
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值