ch4-3 音频信号的频域特征

ZhengXinTang

已于 2022-08-25 11:09:17 修改

阅读量534

点赞数

分类专栏： # 音频部分文章标签：音视频

于 2022-08-25 10:50:43 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chumingqian/article/details/126517546

版权

音频部分专栏收录该内容

44 篇文章 182 订阅

订阅专栏

不同信号的分析方式

在这里插入图片描述

1.　短时傅里叶变换

在短时分析中，
由于在分帧和加窗之后，每一帧中的采样点可以看做有限长度的离散序列；
从而使用DFT。

假设一帧内的采样点共有 $N$ 个，每个采样点使用　 $x [n]$ 　表示；
　 $x [n], w h ere 0 \leq n \leq N - 1$

1.1 DFT 运算

经过DFT 之后，每个点表示为 $\hat x[k]$ :

$\hat x[k] = \sum^{N-1}_{n=0} exp(−i \frac{2\pi}{N} nk) ∙ x[n]$

1.2 DFT 特点

每个点 $\hat x[k]$ 是一个复数信号，
$\hat x[k] |$ : 取复数的实部，便是该复数信号的幅度值，从而得到Ｎ个特征；
相位：取复数的虚数部分；

由于每一个 $\hat x[k]$ 　是由Ｎ个 $x [n]$ 点作为输入，

总共输出Ｎ个 $\hat x[k]$ ，所以计算复杂度是　 $O(N^2)$

2. FFT

为了降低DFT 的计算复杂度 $O(N^2)$ ，

采用了分而治之的思想，复杂度降低为了 $O (N * l o g N)$

2.1 使用条件

FFT中必须满足输入是Ｎ　＝　 $2^k$
,即输入点数的个数必须是２的整数次幂；

3. 短时傅里叶变换

STFT 并不是一个新的运算，是将上述步骤合并起来；

分帧
加窗
FFT

这三个步骤合并起来，　共同称之为短时傅里叶变换：

通过STFT 得到，便是称为　spectrogram;
这便是语谱图；

4. 倒谱　cepstrum()

倒谱产生：是为了方便信号之间解耦；　
列如声源与声通道之间的解耦；

因为信号在时域中的卷积运算，在倒谱域中变为加法运算；

4.1 　信号的频谱　spectrum

x 轴是频率, ｙ轴是幅度值；

对数频谱：

将频谱中的幅度值取对数，得到的便是对数频谱。

4.2 信号的倒谱　cepstrum

信号　－> FT －> 幅度值　－> 　幅度值取对数　－> 傅里叶变换（或者逆傅里叶变换）

此时，频谱的幅度取对数之后作为输入信号，　
对该对数信号进行逆傅里叶变换，得到的频谱称为倒谱。

对数谱在做FFT 变换，得到的是倒谱；

倒谱此时横坐标是时间，纵坐标是什么？

在这里插入图片描述

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。