【语音识别】傅立叶变换0-9数字语音识别【含Matlab源码 384期】

✅博主简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,Matlab项目合作可私信。
🍎个人主页:海神之光
🏆代码获取方式:
海神之光Matlab王者学习之路—代码获取方式
⛳️座右铭:行百里者,半于九十。

更多Matlab仿真内容点击👇
Matlab图像处理(进阶版)
路径规划(Matlab)
神经网络预测与分类(Matlab)
优化求解(Matlab)
语音处理(Matlab)
信号处理(Matlab)
车间调度(Matlab)

⛄一、简介

1 滤波
滤波是将信号中特定波段频率滤除的操作,是抑制和防止干扰的一项重要措施。是根据观察某一随机过程的结果,对另一与之有关的随机过程进行估计的概率理论与方法。
滤波分为经典滤波和现代滤波两种。
经典滤波:
经典滤波的概念,是根据傅里叶分析和变换提出的一个工程概念。根据高等数学理论,任何一个满足一定条件的信号,都可以被看成是由无限个正弦波叠加而成。换句话说,就是工程信号是不同频率的正弦波线性叠加而成的,组成信号的不同频率的正弦波被叫做信号的频率成分或叫做谐波成分。
滤波器:
只允许一定频率范围内的信号成分正常通过,而组织另一部分频率成分通过的电路。叫做经典滤波器或滤波电路。实际上,任何一个电子系统都具有自己的频带宽度(对信号最高频率的限制),频率特性反映了电子系统的这个基本特点。而滤波器,则是根据电路参数对电路频带宽度的影响而设计出来的工程应用电路。
现代滤波
用模拟电子电路对模拟信号进行滤波,其基本原理就是利用电路的频率特性实现对信号中频率成分的选择。根据频率滤波时,是把信号看成是由不同频率正弦波叠加而成的模拟信号,通过选择不同的频率成分来实现信号滤波。
1、当允许信号中较高频率的成分通过滤波器时,这种滤波器叫做高通滤波器。
2、当允许信号中较低频率的成分通过滤波器时,这种滤波器叫做低通滤波器。
3、设低频段的截止频率为fp1,高频段的截止频率为fp2:
1)频率在fp1与fp2之间的信号能通过其它频率的信号被衰减的滤波器叫做带通滤波器。
2)反之,频率在fp1到fp2的范围之间的被衰减,之外能通过的滤波器叫做带阻滤波器。
理想滤波器的行为特性通常用幅度-频率特性图描述,也叫做滤波器电路的幅频特性。

2 傅里叶变换
傅里叶变换是一种积分变换,就是一种从时间到频率的变化。傅里叶原理表明:任何连续测量的时序或信号,都可以表示为不同频率的正弦波信号的无限叠加。可以说,傅里叶变化将原来难以处理的时域信号转化成了易于分析的频率信号(信号的频谱)。
图像的频率是表征(知识在个体心理的反映和存在方式)图像中灰度变化剧烈的程度的指标,是灰度在平面空间上的梯度。图像中是一片灰度变化很缓慢的区域,对应的频率值很低,反之亦然。
从纯粹的数学意义上看,傅里叶变换是将一个函数转化为一系列周期函数来处理。从物理效果看,傅里叶变化是将图像从空间域转换到频率域,其逆变换是将图像从频率转换到空间域。换句话说,傅里叶变换的物理意义是将图像的灰度分布函数转变为图像的频率分布函数,傅里叶逆变化是将图像的频率分布函数变换为灰度分布函数。

3 傅里叶变换的性质
平移性质
在这里插入图片描述
1
2
公式(1)表明将f(x,y)与一个指数项相乘就相当于把其变换后的频域中心移动到新的位置
公式(2)表明将F(u,v)与一个指数项相乘就相当于把其变换后的空域中心移动到新的位置
公式(2)表明对f(x,y)的平移不影响其傅里叶变换的幅值
分配率
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

⛄二、部分源代码

clear all
close
clc;
disp(‘正在计算参考模板的参数…’)
for i=1:10
fname=sprintf(‘%d0.mp3’,i-1);
[x,fs]=audioread(fname);
sound(x,fs);
[x1 x2]=vad(x);
% x1=abs(round(x1));
% x2=abs(round(x2));
m=mfcc(x);
m=m(x1-2:x2-4,:);
ref(i).mfcc=m;
end

disp(‘正在分析语音信号…’)
for i=1:10
fname=sprintf(‘%d0.mp3’,i-1);
%[x,fs,bit]=audioread(fname,[2000,2512]); %采样%
[x,fs]=audioread(fname,[2000,2512]);
%sound(x,fs); %播放语音信号
figure(i);
subplot(3,3,1);
plot(x(1:256)); %原始语音信号的时域图形%
title(‘原始信号’)
subplot(3,3,2)
[h,w]=freqz(x,fs); %原始语音信号的频率响应图
hr=abs(h); %求系统幅频响应
plot(w,hr);
title(‘幅频图’);
xlabel(‘Frequency in rad mple’)
ylabel(‘Magnitude in dB’)
subplot(3,3,3)
hphase=angle(h);
hphase=unwrap(hphase); %求系统相频响应
plot(w,hphase);
title(‘相频图’);
xlabel(‘Frequency in rad mple’)
ylabel(‘Phase in degrees’)
y=fft(x,512); %傅立叶变换%
mag=abs(y);
mag1=10log10(mag);
f=fs
(0:255)/512;
subplot(3,3,4)
plot(f,mag(1:256)); %FFT频谱图 %
title(‘fft变换后信号’)
iff=ifft(y,512); %反傅立叶变换%
ifm=abs(iff);
subplot(3,3,5)
plot(f,ifm(1:256))
title(‘ifft后信号’)
% 短时傅里叶变换
Ts=1/fs;
%N=T/Ts;
N=512;
Nw=20; %窗函数长
L=Nw/2; %窗函数每次移动的样点数
Tn=(N-Nw)/L+1; %计算把数据x共分成多少段
nfft=32;%FFT的长度
Tn=round(Tn);
TF=zeros(Tn,nfft); %将存放三维谱图,先清零
for i=1:Tn
xw=x((i-1)10+1:i10+10); %取一段数据
temp=fft(xw,nfft); %FFT变换
temp=fftshift(temp); %频谱以0频为中心
for j=1:nfft
TF(i,j)=temp(j); %把谱图存放在TF中
end
end
subplot(3,3,6)
fnew=((1:nfft)-nfft/2)*fs/nfft;
tnew=(1:Tn)LTs;
[F,T]=meshgrid(fnew,tnew);
mesh(F,T,abs(TF))
title(‘短时傅立叶变换时频图’)
subplot(3,3,7)
contour(F,T,abs(TF))
title(‘等高线表示’)
end
function cost=testdtw(t,r)
[r1,c1]=size(t);
[r2,c2]=size®;
distance=zeros(r1,r2);
for n=1:r1
for m=1:r2
tr=(t(n,:)-r(m,:)).^2;
distance(n,m)=sqrt(sum(tr)/c1);
%distance(n,m)=sqrt(sum(tr)/c1);
end
end
D=zeros(r1,1);
function f=enframe(x,win,inc)
nx=length(x(😃);
nwin=length(win);
if (nwin == 1)
len = win;
else
len = nwin;
end
if (nargin < 3)
inc = len;
end
function cost=Idtw(t,r)
[r1,c1]=size(t);
[r2,c2]=size®;
distance=zeros(r1,r2);
for n=1:r1
for m=1:r2
tr=(t(n,:)-r(m,:)).^2;
distance(n,m)=sqrt(sum(tr)/c1);
%distance(n,m)=sqrt(sum(tr)/c1);
end
end

⛄三、运行结果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

⛄四、matlab版本及参考文献

1 matlab版本
2014a

2 参考文献
[1]韩纪庆,张磊,郑铁然.语音信号处理(第3版)[M].清华大学出版社,2019.
[2]柳若边.深度学习:语音识别技术实践[M].清华大学出版社,2019.

3 备注
简介此部分摘自互联网,仅供参考,若侵权,联系删除

🍅 仿真咨询
1 各类智能优化算法改进及应用

生产调度、经济调度、装配线调度、充电优化、车间调度、发车优化、水库调度、三维装箱、物流选址、货位优化、公交排班优化、充电桩布局优化、车间布局优化、集装箱船配载优化、水泵组合优化、解医疗资源分配优化、设施布局优化、可视域基站和无人机选址优化

2 机器学习和深度学习方面
卷积神经网络(CNN)、LSTM、支持向量机(SVM)、最小二乘支持向量机(LSSVM)、极限学习机(ELM)、核极限学习机(KELM)、BP、RBF、宽度学习、DBN、RF、RBF、DELM、XGBOOST、TCN实现风电预测、光伏预测、电池寿命预测、辐射源识别、交通流预测、负荷预测、股价预测、PM2.5浓度预测、电池健康状态预测、水体光学参数反演、NLOS信号识别、地铁停车精准预测、变压器故障诊断

3 图像处理方面
图像识别、图像分割、图像检测、图像隐藏、图像配准、图像拼接、图像融合、图像增强、图像压缩感知

4 路径规划方面
旅行商问题(TSP)、车辆路径问题(VRP、MVRP、CVRP、VRPTW等)、无人机三维路径规划、无人机协同、无人机编队、机器人路径规划、栅格地图路径规划、多式联运运输问题、车辆协同无人机路径规划、天线线性阵列分布优化、车间布局优化

5 无人机应用方面
无人机路径规划、无人机控制、无人机编队、无人机协同、无人机任务分配

6 无线传感器定位及布局方面
传感器部署优化、通信协议优化、路由优化、目标定位优化、Dv-Hop定位优化、Leach协议优化、WSN覆盖优化、组播优化、RSSI定位优化

7 信号处理方面
信号识别、信号加密、信号去噪、信号增强、雷达信号处理、信号水印嵌入提取、肌电信号、脑电信号、信号配时优化

8 电力系统方面
微电网优化、无功优化、配电网重构、储能配置

9 元胞自动机方面
交通流 人群疏散 病毒扩散 晶体生长

10 雷达方面
卡尔曼滤波跟踪、航迹关联、航迹融合

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值