1. 各种频率之间的关系
模拟频率:f=1/T,其中 T 是变化周期,单位是秒 s,f 是模拟频率,单位是 HZ/s, 因此, f 的物理含义是信号在 1 秒钟内含有变化周期的个数。
模拟角频率:y=sin(Ωt) 其中 Ω 表示的是模拟角频率,Ω=2π/T 单位是 rad/s ,其表示信号在在 2π 时间内变化周期的个数。假如另 t=1s 那么 Ωt 则表示在 1 秒钟绕圆圈运动的次数(这个是基于 (sinθ)^2+cos(θ)^2=1 ,正弦信号是单位圆上的点在x轴上的投影)。
f 与 Ω 之间的关系: Ω=2πf 根据上面说的物理意义这个也不难理解,f 是 1 s 内周期个数,Ω 是 2π 时间内周期个数,因此系数是 2π。上述这几个频率是描述的模拟信号中的频率关系,由于计算机只能处理离散信号,那么就必须对信号进行采样。假设采样率为 fs,那么采样间隔 Ts=1/fs。
数字频率:在离散信号中 y=sin(ΩnTs)=sin(wt) 其中 w 就是数字频率,根据以上分析可知,w=ΩTs=Ω/fs 所以数字频率是模拟角频率对采样率的归一化频率。
2. DFT中的频率及其物理意义
根据离散傅里叶系列1中的公式(2.2)和上述对各种频率分析可知,
所以,声音的频率与采样率之间的关系如公式(2.2)所示:
在DFT中,假设对N个采样点进行DFT变换,那么在频域也将得到N个频率点,这也意味 N 点DFT的频率分辨率为 fs/N 。假如音频信号的采样率 fs 为1024,如果对 1s 的数据进行分析,即 N=1024,那么此时的分辨率为 1HZ,如果对 2s 的采样数据进行分析,那么此时的分辨率为 0.5HZ。因此,如果想提高频率分析的粒度,就需要提高 N 的值。
3. 实数序列DFT的对称性
在音频分析中,有两个疑问 (1)大咖们常说,为了减少计算量,对于 N 点的傅里叶变换我们常常只分析 前 N/2 频率点,这样会不会丢失信息啊?;(2)根据奈奎斯特采样定理,采样率 fs 至少是音频信号实际频率的两倍才能够恢复原始信号。根据公式(2.1)我们可以知道,由于 k 的最大值为 N-1, DFT变换后的最大频率实际上远远超过音频频率 f。这两个问题之间有什么关系呢? 下面,我尝试从实数DFT 的对称性来说一下我个人的理解。
实数序列DFT的对称性如公式(3.1)和(3.2):
由上述公式可得,X(k) 与 X(N-k) 是共轭关系,由于在音频分析中通常使用DFT的幅度进行计算,也就是取复数模值得平方,因此 X(k) 与 X(N-k)的幅值形成对称关系,只计算前半部分的DFT点数,不会损失音频信息。同时,根据公式 (2.1)前半部分的也覆盖了原始信号的频率范围,后半部分的频率范围也超过了信号的最高频率,也没有分析的价值。