声学特征提取普及笔记

44 篇文章 76 订阅 ¥19.90 ¥99.00

声学特征如何提取?

一、声学特征预处理

首先进行预处理,就是我们最后要提取一帧一帧的这种声学特征,这个语音信号经过预处理然后提取特征,那么特征也有用原始的傅里叶变换,STFT短时傅里叶变换得到这个语谱图特征,也有用FBANK就没有滤波器的输出,还有用MFCC。预处理包括预加重、分帧、加窗。

 预处理---预加重

受到唇端辐射抑制,高频能量明显降低,不利于后续的分析跟识别,所以要进行补偿。就是采用预加重对高频部分的振幅做一些规整,让它减少被动化的影响。

预加重公式就是用前后采样点相减,其中权重系数\sigma =0.97

 预处理---分帧

我们对这个声音要进行分析,就是需要假设声音短时平稳性,才能进行短时分析,就是假定极限它是固定,假设在一个时间段里面它是静态的,才能对曲线的变化特征进行计算,那么这个语音满足短时平稳性,因为我们的发音器官不可能高速在变化,我们在说话的时候,会经过这个发音器官有所调整,但是在短时间内:在这种10~30ms我们可以认为是稳定

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

落雪snowflake

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值