语音信号的时域、频域含义及其表示

1.  时域 & 频域

时域:自变量是时间,即横轴是时间,纵轴是信号的变化(振幅)。

           如下图中红色曲线, 描述信号随时间变化情况  (二维空间:  Time-Amplitude)

频域:自变量是频率,即横轴是频率,纵轴是该频率信号的幅度(振幅)。

           声音信号在频域表现为多个不同频率、振幅信号组成。(给定频率和振幅,可以得到该信号表示,下图中一条蓝色曲线,周期信号)           

在这里插入图片描述

 

2. 时域图(波形图) & 频谱图

时域图:表现的是一段音频在一段时间内音量的变化

              波形实质上是将各个频率的波形叠加在了一起(波形是由各频率不同幅值和相位的简单正弦波复合叠加得到的。)

频谱图:表现的是一段音频在某一时刻各个频率的音量的高低,表示的是一个静态的时间点上各频率正弦波的幅值大小的分布状况  (各个时刻是一样的,即与时间无关)

             直白一点,频谱就是为了找出一个波是由多少波复合而成的

在这里插入图片描述

3. 时域  -->  频域

        在频域的世界观察,你会发现世界是永恒不变的

        语音信号经过傅里叶变化,从时域转换到频域表示,如下图所示

       

4. 时频谱图(语谱图)

语谱图:先将语音信号作傅里叶变换,然后以横轴为时间,纵轴为频率,用颜色表示幅值即可绘制出语谱图。

               在一幅图中表示信号的频率、幅度随时间的变化,故也称“时频图”

python包绘制语谱图

matplotlib.pyplot.specgram(x, NFFT=None, Fs=None, Fc=None, detrend=None, window=None,
 noverlap=None, cmap=None, xextent=None, pad_to=None, sides=None, scale_by_freq=None, 
 mode=None, scale=None, vmin=None, vmax=None, *, data=None, **kwargs)

参数:

x:信号,一维数组或序列

NFFT:fft,点数,默认256,不用0填充,最好为2的整数次方

Fs:采样率,默认为2

Fc:信号x的中心频率,默认为0,用于移动图像

window:窗函数,长度必须等于NFFT(帧长)。默认为汉宁窗

mode:使用什么样的频谱,默认为PSD谱(功率谱)

noverlap:帧重叠点数,默认128

返回值:
spectrum:频谱矩阵
freqs:频谱图每行对应的频率
ts:频谱图每列对应的时间
fig :图像

from scipy.io import wavfile
import matplotlib.pyplot as plt

file='E:/MEAD/database/MEAD-W017/audio/angry/0.wav'
sampling_freq, audio = wavfile.read(file)   # 读取文件

# 语谱图获取
matrix,freqs,ts,fig=matplotlib.pyplot.specgram(audio[:,1],NFFT=256, Fs=sampling_freq)

plt.xlabel("time")
plt.ylabel("frequency")
plt.show()


 

 

  • 13
    点赞
  • 78
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
以下是一个基本的代码实现: ```matlab % 读入原始语音信号 [x,fs] = audioread('input.wav'); % 生成噪声信号 加到原始语音信号中 noise = 0.1*randn(length(x),1); % 生成均值为0,标准差为0.1的高斯白噪声 y = x + noise; % 绘制时域波形 t = 0:1/fs:(length(x)-1)/fs; subplot(2,2,1); plot(t,x); title('原始语音信号'); xlabel('Time (s)'); ylabel('Amplitude'); subplot(2,2,2); plot(t,y); title('加噪声后的语音信号'); xlabel('Time (s)'); ylabel('Amplitude'); % 绘制频域波形 X = abs(fft(x)); f = linspace(0,fs,length(x)); subplot(2,2,3); plot(f,X); title('原始语音信号频谱'); xlabel('Frequency (Hz)'); ylabel('Magnitude'); Y = abs(fft(y)); subplot(2,2,4); plot(f,Y); title('加噪声后的语音信号频谱'); xlabel('Frequency (Hz)'); ylabel('Magnitude'); % 设计FIR滤波器 order = 50; % 滤波器阶数 cutoff = 4000; % 截止频率 b = fir1(order,cutoff/(fs/2)); % 生成FIR滤波器系数 % 滤波处理 filtered = filter(b,1,y); % 绘制滤波器频率响应 [h,w] = freqz(b,1); figure; plot(w/pi*fs/2,20*log10(abs(h))); title('FIR滤波器频率响应'); xlabel('Frequency (Hz)'); ylabel('Magnitude (dB)'); % 绘制滤波后的时域波形和频域波形 subplot(2,2,1); plot(t,x); title('原始语音信号'); xlabel('Time (s)'); ylabel('Amplitude'); subplot(2,2,2); plot(t,filtered); title('滤波后的语音信号'); xlabel('Time (s)'); ylabel('Amplitude'); subplot(2,2,3); plot(f,X); title('原始语音信号频谱'); xlabel('Frequency (Hz)'); ylabel('Magnitude'); F = abs(fft(filtered)); subplot(2,2,4); plot(f,F); title('滤波后的语音信号频谱'); xlabel('Frequency (Hz)'); ylabel('Magnitude'); % 回放滤波后的语音信号 sound(filtered,fs); ``` 需要注意的是,上述代码中的 `input.wav` 是一个wav格式的语音文件,可以根据自己的需要进行替换。同时,代码中的FIR滤波器阶数和截止频率等参数也可以根据实际情况进行调整。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值