语音信号的时域、频域含义及其表示

最新推荐文章于 2024-06-13 17:22:46 发布

Janie.Wei

最新推荐文章于 2024-06-13 17:22:46 发布

阅读量1.3w

点赞数 13

分类专栏： python 语音信号处理文章标签： python 信号处理频域语谱图

本文链接：https://blog.csdn.net/weijie_home/article/details/116211098

版权

python 同时被 2 个专栏收录

18 篇文章

订阅专栏

语音信号处理

5 篇文章

订阅专栏

本文介绍了音频信号的时域和频域表示，时域图展示信号随时间变化，频域图则显示不同频率的幅度分布。通过傅里叶变换，可以将时域信号转化为频域表示。此外，还讲解了语谱图的概念，它是时频分析的一种形式，显示信号在特定时间点各频率的幅度变化。Python的matplotlib库可用于绘制语谱图。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1. 时域 & 频域

时域：自变量是时间，即横轴是时间，纵轴是信号的变化（振幅）。

如下图中红色曲线，描述信号随时间变化情况（二维空间： Time-Amplitude）

频域：自变量是频率，即横轴是频率，纵轴是该频率信号的幅度（振幅）。

声音信号在频域表现为多个不同频率、振幅信号组成。（给定频率和振幅，可以得到该信号表示，下图中一条蓝色曲线，周期信号）

在这里插入图片描述

2. 时域图（波形图） & 频谱图

时域图：表现的是一段音频在一段时间内音量的变化

波形实质上是将各个频率的波形叠加在了一起（波形是由各频率不同幅值和相位的简单正弦波复合叠加得到的。）

频谱图：表现的是一段音频在某一时刻各个频率的音量的高低，表示的是一个静态的时间点上各频率正弦波的幅值大小的分布状况 （各个时刻是一样的，即与时间无关）

直白一点，频谱就是为了找出一个波是由多少波复合而成的

在这里插入图片描述

3. 时域 --> 频域

在频域的世界观察，你会发现世界是永恒不变的

语音信号经过傅里叶变化，从时域转换到频域表示，如下图所示

4. 时频谱图（语谱图）

语谱图：先将语音信号作傅里叶变换，然后以横轴为时间，纵轴为频率，用颜色表示幅值即可绘制出语谱图。

在一幅图中表示信号的频率、幅度随时间的变化，故也称“时频图”。

python包绘制语谱图

matplotlib.pyplot.specgram(x, NFFT=None, Fs=None, Fc=None, detrend=None, window=None,
noverlap=None, cmap=None, xextent=None, pad_to=None, sides=None, scale_by_freq=None,
mode=None, scale=None, vmin=None, vmax=None, *, data=None, **kwargs)

参数：

x：信号，一维数组或序列

NFFT：fft，点数，默认256，不用0填充，最好为2的整数次方

Fs：采样率，默认为2

Fc：信号x的中心频率，默认为0，用于移动图像

window：窗函数，长度必须等于NFFT（帧长）。默认为汉宁窗

mode：使用什么样的频谱，默认为PSD谱（功率谱）

noverlap：帧重叠点数，默认128

返回值：
spectrum:频谱矩阵
freqs：频谱图每行对应的频率
ts：频谱图每列对应的时间
fig ：图像

from scipy.io import wavfile
import matplotlib.pyplot as plt

file='E:/MEAD/database/MEAD-W017/audio/angry/0.wav'
sampling_freq, audio = wavfile.read(file)   # 读取文件

# 语谱图获取
matrix,freqs,ts,fig=matplotlib.pyplot.specgram(audio[:,1],NFFT=256, Fs=sampling_freq)

plt.xlabel("time")
plt.ylabel("frequency")
plt.show()