语音处理的分帧，帧移，加窗，滤波，降噪，合成概念理解

最新推荐文章于 2022-06-02 20:55:24 发布

NO23412号菜狗

最新推荐文章于 2022-06-02 20:55:24 发布

阅读量1.4k

点赞数 2

分类专栏：商业智能算法数据分析与建模

本文链接：https://blog.csdn.net/dudu3332/article/details/117014975

版权

算法同时被 3 个专栏收录

60 篇文章 4 订阅

订阅专栏

数据分析与建模

55 篇文章 1 订阅

订阅专栏

商业智能

18 篇文章 1 订阅

订阅专栏

一、分帧

语音数据和视频数据不同，本没有帧的概念，但是为了传输与存储，我们采集的音频数据都是一段一段的。为了程序能够进行批量处理，会根据指定的长度（时间段或者采样数）进行分段，结构化为我们编程的数据结构，这就是分帧。

二、帧移

由于我们常用的信号处理方法都要求信号是连续的，也就说必须是信号开始到结束，中间不能有断开。然而我们进行采样或者分帧后数据都断开了，所以要在帧与帧之间保留重叠部分数据，以满足连续的要求，这部分重叠数据就是帧移。

三、加窗

介绍帧移的时候我们说了，我们处理信号的方法都要求信号是连续条件，但是分帧处理的时候中间断开了，为了满足条件我们就将分好的帧数据乘一段同长度的数据，这段数据就是窗函数整个周期内的数据，从最小变化到最大，然后最小。

四、滤波

我们知道，我们处理的语音其实是一种声波，声波是一种物质波。滤波的字面意思理解为过滤一些不同频率的波。根据傅里叶变换，我们知道任意波可以分解为几种正弦波和余弦波的叠加，从概率论的角度，滤波即加权。滤波的作用就是给不同的信号分量不同的权重。最简单的loss pass filter，就是直接把低频的信号给0权重，而给高频部分1权重。对于更复杂的滤波，比如维纳滤波, 则要根据信号的统计知识来设计权重。

当允许信号中较高频率的成分通过滤波器时，这种滤波器叫做高通滤波器。
当允许信号中较低频率的成分通过滤波器时，这种滤波器叫做低通滤波器。
当只允许信号中某个频率范围内的成分通过滤波器时，这种滤波器叫做带通滤波器。
当不允许信号中某个频率范围内的成分通过滤波器时，这种滤波器叫做带阻滤波器。

五、降噪

从统计信号处理的角度，降噪可以看成滤波的一种。降噪的目的在于突出信号本身而抑制噪声影响。从这个角度，降噪就是给信号一个高的权重而给噪声一个低的权重。维纳滤波就是一个典型的降噪滤波器。

六、合成

一般的语音处理过程，先分帧，再在频域分成各个子带处理，处理后转成时域，合成语声。从描述上看，语音合成就是和分帧相反的过程，保证信号数据经过我们变换处理后能够回到原来的状态。把每帧各个子带转换成时间序列后相互叠加合成为一帧数据。
————————————————
版权声明：本文为CSDN博主「phymat.nico」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/shixin_0125/article/details/99844048

NO23412号菜狗

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
语音处理的分帧，帧移，加窗，滤波，降噪，合成概念理解

一、分帧语音数据和视频数据不同，本没有帧的概念，但是为了传输与存储，我们采集的音频数据都是一段一段的。为了程序能够进行批量处理，会根据指定的长度（时间段或者采样数）进行分段，结构化为我们编程的数据结构，这就是分帧。二、帧移由于我们常用的信号处理方法都要求信号是连续的，也就说必须是信号开始到结束，中间不能有断开。然而我们进行采样或者分帧后数据都断开了，所以要在帧与帧之间保留重叠部分数据，以满足连续的要求，这部分重叠数据就是帧移。三、加窗介绍帧移的时候我们说了，我们处理信号的方法都要求信号是
复制链接

扫一扫