语音信号分析之FFT变换过程

语音信号分析从FFT变换开始

概述

语音信号是人为经过声学设备采集转换而来的便于编码、储存以及做声学处理用途抽象而成的信号。首先一段WAV音频拥有固定的几个参数用来规定语音信号的属性。正确的区分通道数、采样率、分辨率这些基本参数是语音信号分析的基本功。

语音采集

声学麦克风设备当前有很多种,普通单麦、双麦、线麦、环麦。麦克风阵列不同,对于工程上面的分析和处理有不同的实际要求。而它们在整体处理流程上面是一致的。而无论是想做AEC(声学回声消除)、GSC(旁瓣相消)、NR(噪声消除)这些基本的前端声学信号处理,都离不开一个常用的分析方法—频域分析法。想使用频域分析法,前提是要保证原始音频信号的正确性和完整性。现在多数的设备上都是通过PCM模块从底层直接给上层提供转换好的数字信号。应用层工程师可以直接用PCM原始数据进行处理和输出。

语音信号预处理

当然,很多刚开始入门的人都不太明白为什么需要将信号放在频域上面进行处理。也不知道怎么将信号从时域转换到频域。毕竟当初在学校学习微积分-拉普拉斯变换-积分变换各种数学工具时,根本不清楚这些数学工具的思想和实际用途。虽然数学是搞语音信号处理或者机器学习等热门行业的拦路虎,但是从一个点入手,把数学从实际的工程再抽象回理论,是比当初在学校中生硬的理解公式要有趣和容易的多。
声学信号处理常用的FFT点数从256-4096都有,这取决与工程中面对实际问题时的取舍和决策。而每一个FFT点数我们可以理解为是一个频点。语音信号的采样率16000是基于采样定理和人耳能分辨的最高频8k而定的。现在我们简单的跳过一系列的严谨的数学推理,简单的理解FFT就是一个工具,把连续的声学信号通过FFT变换成分辨率为256-4096不等,分别对应0-8k等分频点的数据。那么比如

  • 5
    点赞
  • 40
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值