语音信号的时域、频域含义及其表示

本文介绍了音频信号的时域和频域表示,时域图展示信号随时间变化,频域图则显示不同频率的幅度分布。通过傅里叶变换,可以将时域信号转化为频域表示。此外,还讲解了语谱图的概念,它是时频分析的一种形式,显示信号在特定时间点各频率的幅度变化。Python的matplotlib库可用于绘制语谱图。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.  时域 & 频域

时域:自变量是时间,即横轴是时间,纵轴是信号的变化(振幅)。

           如下图中红色曲线, 描述信号随时间变化情况  (二维空间:  Time-Amplitude)

频域:自变量是频率,即横轴是频率,纵轴是该频率信号的幅度(振幅)。

           声音信号在频域表现为多个不同频率、振幅信号组成。(给定频率和振幅,可以得到该信号表示,下图中一条蓝色曲线,周期信号)           

在这里插入图片描述

 

2. 时域图(波形图) & 频谱图

时域图:表现的是一段音频在一段时间内音量的变化

              波形实质上是将各个频率的波形叠加在了一起(波形是由各频率不同幅值和相位的简单正弦波复合叠加得到的。)

频谱图:表现的是一段音频在某一时刻各个频率的音量的高低,表示的是一个静态的时间点上各频率正弦波的幅值大小的分布状况  (各个时刻是一样的,即与时间无关)

             直白一点,频谱就是为了找出一个波是由多少波复合而成的

在这里插入图片描述

3. 时域  -->  频域

        在频域的世界观察,你会发现世界是永恒不变的

        语音信号经过傅里叶变化,从时域转换到频域表示,如下图所示

       

4. 时频谱图(语谱图)

语谱图:先将语音信号作傅里叶变换,然后以横轴为时间,纵轴为频率,用颜色表示幅值即可绘制出语谱图。

               在一幅图中表示信号的频率、幅度随时间的变化,故也称“时频图”

python包绘制语谱图

matplotlib.pyplot.specgram(x, NFFT=None, Fs=None, Fc=None, detrend=None, window=None,
 noverlap=None, cmap=None, xextent=None, pad_to=None, sides=None, scale_by_freq=None, 
 mode=None, scale=None, vmin=None, vmax=None, *, data=None, **kwargs)

参数:

x:信号,一维数组或序列

NFFT:fft,点数,默认256,不用0填充,最好为2的整数次方

Fs:采样率,默认为2

Fc:信号x的中心频率,默认为0,用于移动图像

window:窗函数,长度必须等于NFFT(帧长)。默认为汉宁窗

mode:使用什么样的频谱,默认为PSD谱(功率谱)

noverlap:帧重叠点数,默认128

返回值:
spectrum:频谱矩阵
freqs:频谱图每行对应的频率
ts:频谱图每列对应的时间
fig :图像

from scipy.io import wavfile
import matplotlib.pyplot as plt

file='E:/MEAD/database/MEAD-W017/audio/angry/0.wav'
sampling_freq, audio = wavfile.read(file)   # 读取文件

# 语谱图获取
matrix,freqs,ts,fig=matplotlib.pyplot.specgram(audio[:,1],NFFT=256, Fs=sampling_freq)

plt.xlabel("time")
plt.ylabel("frequency")
plt.show()


 

 

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值