java audio 分帧_语音信号处理基础(五)——语音分帧与加窗

文章目录

原理

1.加窗

2.分帧

一般而言语音处理的目的有两种:

一种是对语音信号进行分析,提取特征参数,用于后续处理;

提取的特征参数主要有语音的短时能量和平均幅度、短时平均过零率、短时自相关函数和短时平均幅度差函数等

另一种是加工语音信号,

例如在语音增强中对含噪语音进行背景噪声抑制,以获得相对“干净”的语音;在语音合成方中需要对分段语音进行拼接平滑,获得主观音质较高的合成语音,这方面的应用同样是建立在分析并提取语音信号信息的基础上的。总之,语音信号分析的目的就在于方便有效地提取并表示语音信号所携带的信息。

根据所分析的参数类型,语音信号分析可以分成时域分析和变换域(频域、倒谱域)分析。其中时域分析方法是最简单、最直观的方法,它直接对语音信号的时域波形进行分析,

提取的特征参数主要有语音的短时能量和平均幅度、短时平均过零率、短时自相关函数和短时平均幅度差函数等。

原理

不论是分析怎样的参数以及采用什么分析方法,在按帧进行语音分析、提取语音参数之前,有一些经常使用的、共同的短时分析技术必须预先进行,如语音信号的数字化、预加重、加窗和分帧等,这些也是不可忽视的语音信号分析的关键技术。

1.加窗

窗函数可以加在时域或频域上,更多的是加在时域上

常用的窗函数

1.矩形窗

w ( n ) = { 1 , 0 ⩽ n ⩽ N − 1 0 , 其 他 w(n)=\left\{\begin{array}{ll}{1,} & {0 \leqslant n \leqslant N-1} \\ {0,} & {其他}\end{array}\right.w(n)={1,0,​0⩽n⩽N−1其他​

f6553f38e393a9239ccd0a1e1699f6a1.png

2.汉明窗

w ( n ) = { 0.54 − 0.46 cos ⁡ [ 2 π n / ( N − 1 ) ] , 0 ⩽ n ⩽ N 0 ,  其他  w(n)=\left\{\begin{array}{ll}{0.54-0.46 \cos [2 \pi n /(N-1)],} & {0 \leqslant n \leqslant N} \\ {0,} & {\text { 其他 }}\end{array}\right.w(n)={0.54−0.46cos[2πn/(N−1)],0,​0⩽n⩽N其他​

5b48b250b6a5e360d8ae57d2938ee73a.png3.海宁窗

w ( n ) = { 0.5 ( 1 − cos ⁡ [ 2 π n / ( N − 1 ) ] ) , 0 ⩽ n ⩽ N 0 ,  其他  w(n)=\left\{\begin{array}{ll}{0.5(1-\cos [2 \pi n /(N-1)]),} & {0 \leqslant n \leqslant N} \\ {0,} & {\text { 其他 }}\end{array}\r

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值