波的时频分析方法——短时傅里叶变换（STFT）变换详解

DuHz

已于 2025-05-01 08:52:34 修改

阅读量7.1k

点赞数 13

文章标签：傅立叶分析数学建模信号处理信息与通信算法人工智能概率论

于 2024-11-06 23:44:11 首次发布

本文链接：https://blog.csdn.net/qq_44648285/article/details/143582458

版权

波的时频分析方法——短时傅里叶变换（STFT）详解

短时傅里叶变换（Short-Time Fourier Transform, STFT）是时频分析中的一种重要方法，广泛应用于信号处理、语音识别、图像处理、生物医学工程等领域。STFT通过在时间和频率两个维度上同时分析信号，能够有效地捕捉信号的时变特性。本文将详细介绍STFT的基本概念、数学基础、窗函数的选择、变换性质、计算方法、应用案例，并附带示例代码及其简要解读，以帮助读者深入理解和掌握STFT。

短时傅里叶变换的基本概念
短时傅里叶变换的数学基础
- 傅里叶变换回顾
- 短时傅里叶变换的定义
- 窗函数的作用
- 时频分辨率与不确定性原理
短时傅里叶变换的计算方法
- 窗函数的选择
- 分帧与窗函数应用
- STFT的离散实现
短时傅里叶变换的性质
- 时频局部化
- 可逆性
- 能量保持
- 时移与频移性质
短时傅里叶变换的应用
- 音频信号分析
- 语音识别
- 生物医学信号处理
- 通信信号分析
- 图像处理
示例代码及解读
- 示例：使用Python进行STFT并绘制时频图
结语

短时傅里叶变换的基本概念

短时傅里叶变换（Short-Time Fourier Transform, STFT）是一种将信号分割成短时间段，并在每个时间段内进行傅里叶变换的方法。通过这种方式，STFT能够同时提供信号在时间和频率上的局部信息，适用于分析非平稳信号。

STFT的优势：

时频局部化：能够在时间和频率两个维度上同时分析信号的变化。
多分辨率分析：通过调整窗函数的长度，可以在不同时间和频率尺度上进行分析。
适用于非平稳信号：能够有效捕捉信号的瞬态变化和时变特性。

STFT的应用：
STFT广泛应用于音频信号分析、语音识别、生物医学信号处理、通信信号分析、图像处理等领域，帮助研究人员和工程师理解和处理复杂的时变信号。

短时傅里叶变换的数学基础

傅里叶变换回顾

在深入理解STFT之前，先回顾一下傅里叶变换的基本概念。

傅里叶变换将一个时间域信号 $f (t)$ 分解为不同频率的正弦和余弦波的叠加，表示为：
$F(\omega) = \int_{-\infty}^{\infty} f(t) e^{-i\omega t} \, dt$
其中， $F(\omega)$ 是频域表示， $\omega$ 是角频率。

傅里叶变换适用于分析平稳信号，即频率成分在时间上保持不变的信号。然而，许多实际信号是非平稳信号，其频率成分随时间变化，此时傅里叶变换无法提供足够的时域信息。

短时傅里叶变换的定义

短时傅里叶变换通过在信号上应用窗函数，将信号分割成多个短时间段，并在每个时间段内进行傅里叶变换，从而得到时频域的局部信息。

数学上，STFT定义为：
$STFT\{f(t)\}(t, \omega) = \int_{-\infty}^{\infty} f(\tau) w(\tau - t) e^{-i\omega \tau} \, d\tau$
其中：

$f (t)$ 是待分析的信号。
$w (t)$ 是窗函数，用于限定分析的时间范围。
$t$ 是时间变量，表示窗函数的中心位置。
$\omega$ 是角频率，表示信号的频率成分。

通过滑动窗函数 $w(\tau - t)$ 在信号 $f (t)$ 上，STFT在每个时间点 $t$ 对信号进行局部傅里叶变换，得到频率成分 $\omega$ 的幅度和相位信息。

窗函数的作用

窗函数在STFT中起着至关重要的作用，主要用于限定傅里叶变换的时间范围，确保变换的局部性。常见的窗函数包括矩形窗、汉明窗、汉宁窗、布莱克曼窗等。

窗函数的性质：

有限支撑：窗函数在有限时间范围内非零，确保傅里叶变换的局部性。
平滑性：窗函数应尽量平滑，以减少频谱泄露和旁瓣效应。
正交性（对于某些应用）：窗函数的正交性有助于提高频谱分析的准确性。

常见窗函数：

矩形窗：
$\begin{cases} 1 & |t| \leq \frac{T}{2} \\ 0 & \text{其他} \end{cases}$
特点：简单易实现，但频谱泄露严重。
汉明窗（Hamming Window）：
$\cos\left(\frac{2\pi t}{T}\right), \quad |t| \leq \frac{T}{2}$
特点：较好的频谱性能，减少旁瓣效应。
汉宁窗（Hanning Window）：
$\left[1 - \cos\left(\frac{2\pi t}{T}\right)\right], \quad |t| \leq \frac{T}{2}$
特点：平滑性好，适用于减少频谱泄露。
布莱克曼窗（Blackman Window）：
$\cos\left(\frac{2\pi t}{T}\right) + 0.08 \cos\left(\frac{4\pi t}{T}\right), \quad |t| \leq \frac{T}{2}$
特点：更高的频谱分辨率和更低的旁瓣泄露。

时频分辨率与不确定性原理

时频分辨率是STFT的重要特性，决定了变换在时间和频率两个维度上的分辨能力。窗函数的长度直接影响时频分辨率：

短窗：提供较高的时间分辨率，但频率分辨率较低。
长窗：提供较高的频率分辨率，但时间分辨率较低。

这种权衡关系源于Heisenberg不确定性原理，即同时提高时间和频率分辨率是不可能的。

数学上，不确定性原理表示为：
$\Delta t \Delta \omega \geq \frac{1}{2}$
其中， $\Delta t$ 是时间不确定性， $\Delta \omega$ 是频率不确定性。

因此，在选择窗函数时，需要根据具体应用需求在时间和频率分辨率之间进行权衡。

短时傅里叶变换的计算方法

窗函数的选择

窗函数的选择对于STFT的性能影响显著。选择合适的窗函数需要考虑以下因素：

应用需求：不同应用对时频分辨率的要求不同，如音频分析更注重频率分辨率，语音识别更注重时间分辨率。
信号特性：信号的瞬态变化和频率变化速率决定了窗函数的长度和形状。
计算复杂度：简单的窗函数（如矩形窗）计算效率高，但频谱性能较差；复杂的窗函数（如布莱克曼窗）计算复杂度高，但频谱性能优越。

分帧与窗函数应用

在实际计算中，STFT通常采用分帧（Framing）的方法，将长时间信号分割为多个短时间帧，并对每个帧应用窗函数。

分帧步骤：

选择窗函数：根据应用需求选择合适的窗函数及其长度 $T$ 。
设定帧移（Hop Size）：帧移决定了窗函数在时间轴上的滑动步长，常见的帧移为窗函数长度的50%或75%。
分割信号：将信号分割为多个重叠的短时间帧，每帧长度为窗函数长度 $T$ 。
窗函数应用：对每个帧乘以窗函数，得到加窗后的信号片段。

STFT的离散实现

在实际应用中，信号通常是离散的，因此STFT也需要进行离散化处理。

离散STFT的定义：
$STFT\{x[n]\}(m, k) = \sum_{n=-\infty}^{\infty} x[n] w[n - m] e^{-i 2\pi k n / N}$
其中：

$x [n]$ 是离散时间信号。
$w [n - m]$ 是窗函数，中心在时间点 $m$ 。
$k$ 是离散频率索引， $N$ 是傅里叶变换的点数。

快速计算方法：
通常，离散STFT通过快速傅里叶变换（FFT）实现，以提高计算效率。具体步骤如下：

分帧：将信号分割为多个短时间帧，每帧长度为 $N$ 点，窗函数应用于每帧。
FFT计算：对每个窗函数应用后的帧进行FFT，得到频域表示。
时频矩阵：将所有帧的FFT结果按时间顺序排列，形成时频矩阵，便于后续分析和可视化。

短时傅里叶变换的性质

时频局部化

STFT通过窗函数在时间轴上的局部化，使得变换结果能够反映信号在不同时间段内的频率成分变化。这种时频局部化能力使STFT适用于分析非平稳信号，捕捉信号的瞬态特性。

可逆性

在满足一定条件下，STFT是可逆的，即可以通过逆STFT（Inverse Short-Time Fourier Transform, ISTFT）恢复原始信号。逆STFT公式为：
$\int_{-\infty}^{\infty} \int_{0}^{\infty} STFT\{x(t)\}(t', \omega) w(t - t') e^{i\omega t} \, d\omega \, dt'$

能量保持

STFT满足能量保持性质，即信号的总能量在时频域内保持不变：
$\int_{-\infty}^{\infty} |x(t)|^2 \, dt = \int_{-\infty}^{\infty} \int_{0}^{\infty} |STFT\{x(t)\}(t, \omega)|^2 \, d\omega \, dt$

时移与频移性质

时移：信号在时间轴上的平移对应于STFT结果在时间轴上的平移。
$STFT\{x(t - \tau)\}(t, \omega) = STFT\{x(t)\}(t - \tau, \omega)$
频移：信号在频率上的平移对应于STFT结果在频率轴上的相位旋转。
$STFT\{x(t) e^{i\omega_0 t}\}(t, \omega) = STFT\{x(t)\}(t, \omega - \omega_0)$

短时傅里叶变换的应用

音频信号分析

STFT在音频信号分析中应用广泛，如语音识别、音乐信息检索、音频特征提取等。通过STFT，可以分析音频信号在不同时间段内的频谱变化，提取音高、音色等特征。

语音识别

在语音识别系统中，STFT用于将语音信号转换为时频域的表示，提取声学特征（如梅尔频率倒谱系数，MFCC），提高识别准确性和鲁棒性。

生物医学信号处理

STFT在生物医学信号处理中的应用包括心电图（ECG）分析、脑电图（EEG）分析等。通过STFT，可以识别信号中的异常频率成分，辅助诊断和监测。

通信信号分析

在通信系统中，STFT用于分析调制信号的频谱特性、检测信号中的频率偏移和多径效应，优化信号处理算法，提高通信质量。

图像处理

STFT也可扩展到二维信号（如图像）的时频分析，用于图像纹理分析、图像压缩和去噪等应用。

高级小波变换概念

（本节内容可根据需要扩展）

示例代码及解读

示例：使用Python进行STFT并绘制时频图

以下示例代码演示如何使用Python中的librosa和matplotlib库进行STFT计算，并绘制信号的时频图（频谱图）。

import numpy as np
import matplotlib.pyplot as plt
import librosa
import librosa.display

# 生成示例信号：一个包含两个不同频率成分的信号
sr = 8000  # 采样率8000Hz
t = np.linspace(0, 1, sr, endpoint=False)
f1, f2 = 300, 1500  # 两个频率成分300Hz和1500Hz
signal = 0.5 * np.sin(2 * np.pi * f1 * t) + 0.5 * np.sin(2 * np.pi * f2 * t)

# 添加噪声
noise = np.random.normal(0, 0.3, signal.shape)
noisy_signal = signal + noise

# 设置STFT参数
n_fft = 1024  # FFT点数
hop_length = 256  # 帧移
window = 'hann'  # 窗函数

# 计算STFT
stft_result = librosa.stft(noisy_signal, n_fft=n_fft, hop_length=hop_length, window=window)

# 计算幅度谱并转换为dB
stft_db = librosa.amplitude_to_db(np.abs(stft_result), ref=np.max)

# 绘制时频图
plt.figure(figsize=(14, 6))
librosa.display.specshow(stft_db, sr=sr, hop_length=hop_length, x_axis='time', y_axis='hz', cmap='magma')
plt.colorbar(format='%+2.0f dB')
plt.title('信号的时频图（STFT）')
plt.xlabel('时间 (秒)')
plt.ylabel('频率 (Hz)')
plt.tight_layout()
plt.show()

代码解读

导入库：

numpy用于数值计算。
matplotlib.pyplot用于绘图。
librosa及其子模块librosa.display用于音频信号处理和可视化。

生成示例信号：

定义采样率 sr 为8000Hz。
生成时间向量 t 从0到1秒，共8000个采样点。
创建一个包含两个正弦波频率成分（300Hz和1500Hz）的信号 signal。
添加高斯噪声 noise，标准差为0.3，得到含噪声信号 noisy_signal。

设置STFT参数：

n_fft：FFT点数，决定频率分辨率。1024点对应的频率分辨率为 sr / n_fft = 7.8125 Hz。
hop_length：帧移，决定时间分辨率。256点帧移对应的时间分辨率为 hop_length / sr = 0.032秒。
window：窗函数选择汉宁窗（Hann window），用于减少频谱泄露。

计算STFT：

使用 librosa.stft 函数对含噪声信号进行STFT计算，得到复数频谱矩阵 stft_result。

计算幅度谱并转换为dB：

使用 librosa.amplitude_to_db 函数将幅度谱转换为分贝（dB）尺度，得到 stft_db，便于可视化。

绘制时频图

结语

短时傅里叶变换（STFT）作为时频分析的重要工具，凭借其时频局部化和多分辨率分析的特点，能够有效地分析和处理各种复杂的非平稳信号。本文详细介绍了STFT的基本概念、数学基础、窗函数的选择、变换性质、计算方法，以及其在音频信号分析、语音识别、生物医学信号处理等领域的广泛应用，并通过示例代码展示了如何在Python中实现STFT并绘制时频图。