语音信号分析之FFT变换过程

最新推荐文章于 2024-07-19 13:00:04 发布

来福的猫窝

最新推荐文章于 2024-07-19 13:00:04 发布

阅读量6.2k

点赞数 5

分类专栏：语音识别信号处理文章标签：语音信号处理 FFT 频域

本文链接：https://blog.csdn.net/weixin_42836272/article/details/106461862

版权

语音信号分析从FFT变换开始

概述

语音信号是人为经过声学设备采集转换而来的便于编码、储存以及做声学处理用途抽象而成的信号。首先一段WAV音频拥有固定的几个参数用来规定语音信号的属性。正确的区分通道数、采样率、分辨率这些基本参数是语音信号分析的基本功。

语音采集

声学麦克风设备当前有很多种，普通单麦、双麦、线麦、环麦。麦克风阵列不同，对于工程上面的分析和处理有不同的实际要求。而它们在整体处理流程上面是一致的。而无论是想做AEC(声学回声消除)、GSC（旁瓣相消）、NR（噪声消除）这些基本的前端声学信号处理，都离不开一个常用的分析方法—频域分析法。想使用频域分析法，前提是要保证原始音频信号的正确性和完整性。现在多数的设备上都是通过PCM模块从底层直接给上层提供转换好的数字信号。应用层工程师可以直接用PCM原始数据进行处理和输出。

语音信号预处理

当然，很多刚开始入门的人都不太明白为什么需要将信号放在频域上面进行处理。也不知道怎么将信号从时域转换到频域。毕竟当初在学校学习微积分-拉普拉斯变换-积分变换各种数学工具时，根本不清楚这些数学工具的思想和实际用途。虽然数学是搞语音信号处理或者机器学习等热门行业的拦路虎，但是从一个点入手，把数学从实际的工程再抽象回理论，是比当初在学校中生硬的理解公式要有趣和容易的多。
声学信号处理常用的FFT点数从256-4096都有，这取决与工程中面对实际问题时的取舍和决策。而每一个FFT点数我们可以理解为是一个频点。语音信号的采样率16000是基于采样定理和人耳能分辨的最高频8k而定的。现在我们简单的跳过一系列的严谨的数学推理，简单的理解FFT就是一个工具，把连续的声学信号通过FFT变换成分辨率为256-4096不等，分别对应0-8k等分频点的数据。那么比如

最低0.47元/天解锁文章

来福的猫窝

关注

5
点赞
踩
40

收藏

觉得还不错? 一键收藏
0
评论
语音信号分析之FFT变换过程

语音信号分析从FFT变换开始概述语音信号是人为经过声学设备采集转换而来的便于编码、储存以及做声学处理用途抽象而成的信号。首先一段WAV音频拥有固定的几个参数用来规定语音信号的属性。正确的区分通道数、采样率、分辨率这些基本参数是语音信号分析的基本功。语音采集声学麦克风设备当前有很多种，普通单麦、双麦、线麦、环麦。麦克风阵列不同，对于工程上面的分析和处理有不同的实际要求。而它们在整体处理流程上面是一致的。而无论是想做AEC(声学回声消除)、GSC（旁瓣相消）、NR（噪声消除）这些基本的前端声学信号处理，
复制链接

扫一扫

专栏目录