java audio 分帧_语音信号处理基础（五）——语音分帧与加窗

最新推荐文章于 2024-07-08 02:35:53 发布

陈立为

最新推荐文章于 2024-07-08 02:35:53 发布

阅读量2.1k

点赞数

文章标签： java audio 分帧

本文链接：https://blog.csdn.net/weixin_33139087/article/details/114224902

版权

本文介绍了语音信号处理中的加窗和分帧技术，这两种技术是语音分析的关键步骤。加窗常用窗函数包括矩形窗、汉明窗和海宁窗，不同窗函数在时域和频域有不同的特性，选择合适的窗函数能更好地反映语音信号的频率特性。分帧是基于语音的短时平稳性，通常帧长为10-30ms，通过交叠分段减少截断效应，确保信号连续性。通过MATLAB示例展示了如何在不使用窗函数的情况下对语音信号进行分帧操作。

摘要由CSDN通过智能技术生成

文章目录

原理

1.加窗

2.分帧

一般而言语音处理的目的有两种：

一种是对语音信号进行分析，提取特征参数，用于后续处理；

提取的特征参数主要有语音的短时能量和平均幅度、短时平均过零率、短时自相关函数和短时平均幅度差函数等

另一种是加工语音信号，

例如在语音增强中对含噪语音进行背景噪声抑制，以获得相对“干净”的语音；在语音合成方中需要对分段语音进行拼接平滑，获得主观音质较高的合成语音，这方面的应用同样是建立在分析并提取语音信号信息的基础上的。总之，语音信号分析的目的就在于方便有效地提取并表示语音信号所携带的信息。

根据所分析的参数类型，语音信号分析可以分成时域分析和变换域(频域、倒谱域)分析。其中时域分析方法是最简单、最直观的方法，它直接对语音信号的时域波形进行分析，

提取的特征参数主要有语音的短时能量和平均幅度、短时平均过零率、短时自相关函数和短时平均幅度差函数等。

原理

不论是分析怎样的参数以及采用什么分析方法，在按帧进行语音分析、提取语音参数之前，有一些经常使用的、共同的短时分析技术必须预先进行，如语音信号的数字化、预加重、加窗和分帧等，这些也是不可忽视的语音信号分析的关键技术。

1.加窗

窗函数可以加在时域或频域上，更多的是加在时域上

常用的窗函数

1.矩形窗

w ( n ) = { 1 , 0 ⩽ n ⩽ N − 1 0 , 其他 w(n)=\left\{\begin{array}{ll}{1,} & {0 \leqslant n \leqslant N-1} \\ {0,} & {其他}\end{array}\right.w(n)={1,0,0⩽n⩽N−1其他

2.汉明窗

w ( n ) = { 0.54 − 0.46 cos ⁡ [ 2 π n / ( N − 1 ) ] , 0 ⩽ n ⩽ N 0 , 其他 w(n)=\left\{\begin{array}{ll}{0.54-0.46 \cos [2 \pi n /(N-1)],} & {0 \leqslant n \leqslant N} \\ {0,} & {\text { 其他 }}\end{array}\right.w(n)={0.54−0.46cos[2πn/(N−1)],0,0⩽n⩽N其他

3.海宁窗

w ( n ) = { 0.5 ( 1 − cos ⁡ [ 2 π n / ( N − 1 ) ] ) , 0 ⩽ n ⩽ N 0 , 其他 w(n)=\left\{\begin{array}{ll}{0.5(1-\cos [2 \pi n /(N-1)]),} & {0 \leqslant n \leqslant N} \\ {0,} & {\text { 其他 }}\end{array}\r

最低0.47元/天解锁文章

陈立为

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫