【语音分析】短时自相关基音周期检测+LPC预测增益计算【含Matlab源码 1517期】

✅博主简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,Matlab项目合作可私信。
🍎个人主页:海神之光
🏆代码获取方式:
海神之光Matlab王者学习之路—代码获取方式
⛳️座右铭:行百里者,半于九十。

更多Matlab仿真内容点击👇
Matlab图像处理(进阶版)
路径规划(Matlab)
神经网络预测与分类(Matlab)
优化求解(Matlab)
语音处理(Matlab)
信号处理(Matlab)
车间调度(Matlab)

⛄一、案例简介

1 实验要求
1.录一段声音,内容为“间隔读出数字0-4”,转为单声道、8khz、wav格式;
2.每帧帧长20ms160个样点,使用汉明窗hamming加窗;
3.设定能量阈值,判断语音中无声、有声区间;
4.计算短时自相关 R(k),k取20-100,计算基音周期和基音频率;
5.信息预测:数字“0”的预测增益E0/Ep(原始信号能量/残差信号能量),并求预测系数a1-a10,阶数p取10。

2 思 路
先对声音进行窗函数划分帧,160个样点一帧,计算各帧短时能量,设定能量阈值筛选出5段浊音段,每段分别进行以下操作:段中的每一帧计算自相关函数(k为自相关滞后时间,取20-100),通过波峰最大值点计算得到该帧浊音的基音频率,进而计算该段的基音频率,进而计算5段浊音段的基音频率。
对于信息预测,对于数字“0”的语音段的某一帧(如第101帧),利用lpc 函数得到阶数取10下的预测系数,进而计算预测信号及残差信号,利用预测增益公式E0/Ep(原始信号能量/残差信号能量)计算得到预测增益。

⛄二、部分源代码

clc;
clear all;
close all;

% 读取语料
[y,fs,wmode,fidx]=readwav(‘number.wav’,‘p’,-1,-1);
figure(1);stem(y,‘.’);title(‘原始音频波形’);%显示声音的波形
%l=length(y);

%分帧
%f=enframe(y,hamming(160)); %分帧长:20ms(160样点)
%figure(2);stem(f,‘.’);title(‘分帧后的音频波形’);%显示声音的波形

%加窗,计算短时能量
for k = 1:nFrames

E(k) = sum(y_sub.^2); 

end
figure(2);stem(E,‘.’);title(‘全区间的短时能量图’);

%如何设定能量阈值为0.001得到安静、有声的区间?
for i = 1:nFrames
if E(i)<0.001
E(i)=0
end
end
figure(3);stem(E,‘.’);title(‘有声区间的短时能量图’);%处理后的帧的短时能量图像

%计算短时自相关
n=160;
for m=1:length(y)/n %对每一帧求短时自相关函数,每帧的Rm最大值存在N(m)里

    Rm(k)=0;
 
        Rm(k)=Rm(k)+y(i+(m-1)*n)*y(i+k+(m-1)*n);
    end
end

end

%计算基音周期和基音频率
%N=N+10; %补回前边去掉的10个点
%T=N/8; %算出对应的周期

figure(4);stem(T,‘.’);axis([0 length(T) 0 20]);
xlabel(‘帧数(n)’);ylabel(‘周期(ms)’);title(‘初始未处理的基音周期’);

T1= medfilt1(T,7); %去除野点,中值平滑
for k = 1:nFrames
if E(k)==0
T1(k)=0;
end
end
figure(5);stem(T1,‘.’);axis([0 length(T1) 0 20]);
xlabel(‘帧数(n)’);ylabel(‘周期(ms)’);title(‘中值滤波后的基音周期’);

for k = 1:nFrames
if E(k)==0
F1(k)=0;
end
end
figure(6);stem(F1,‘.’);
xlabel(‘帧数(n)’);ylabel(‘频率(Hz)’);title(‘基音频率’);

%计算数字“0”的差分方程系数和预测增益

y1=y(99160:100160-1); %取数字“0”的一帧(第100帧),进行汉明加窗
A=lpc(y1.w,p); %得到系数(11个系数中第一个系数值为1)
est_Frame=filter([0 -A(2:end)],1,y1);%estimate frame(lp)预测第100/101帧?
FFT_est=fft(est_Frame);
%y2=y(100
160:101*160-1);

figure(7);
%subplot(221);plot(1:3360,y1,1:3360,est_Frame,‘-r’);grid;title(‘原始语音帧 vs.预测后的语音帧’);
subplot(221);plot(y1);grid;title(‘原始语音段’);
%subplot(222);plot(est_Frame);grid;title(‘预测语音段’);
subplot(222);plot(est_Frame);grid;title({‘预测语音段及10个预测系数’,[num2str(A(2)),‘,’,num2str(A(3)),‘,’,num2str(A(4)),‘,’,num2str(A(5)),‘,’,num2str(A(6)),‘,’,num2str(A(7)),‘,’,num2str(A(8)),‘,’,num2str(A(9)),‘,’,num2str(A(10)),‘,’,num2str(A(11))]});
subplot(223);plot(err);grid;title(‘误差’);
subplot(224);plot(prodictive_gain);grid;title(‘预测增益’);

⛄三、运行结果

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

⛄四、matlab版本及参考文献

1 matlab版本
2014a

2 参考文献
[1]韩纪庆,张磊,郑铁然.语音信号处理(第3版)[M].清华大学出版社,2019.
[2]柳若边.深度学习:语音识别技术实践[M].清华大学出版社,2019.

3 备注
简介此部分摘自互联网,仅供参考,若侵权,联系删除

🍅 仿真咨询
1 各类智能优化算法改进及应用

生产调度、经济调度、装配线调度、充电优化、车间调度、发车优化、水库调度、三维装箱、物流选址、货位优化、公交排班优化、充电桩布局优化、车间布局优化、集装箱船配载优化、水泵组合优化、解医疗资源分配优化、设施布局优化、可视域基站和无人机选址优化

2 机器学习和深度学习方面
卷积神经网络(CNN)、LSTM、支持向量机(SVM)、最小二乘支持向量机(LSSVM)、极限学习机(ELM)、核极限学习机(KELM)、BP、RBF、宽度学习、DBN、RF、RBF、DELM、XGBOOST、TCN实现风电预测、光伏预测、电池寿命预测、辐射源识别、交通流预测、负荷预测、股价预测、PM2.5浓度预测、电池健康状态预测、水体光学参数反演、NLOS信号识别、地铁停车精准预测、变压器故障诊断

3 图像处理方面
图像识别、图像分割、图像检测、图像隐藏、图像配准、图像拼接、图像融合、图像增强、图像压缩感知

4 路径规划方面
旅行商问题(TSP)、车辆路径问题(VRP、MVRP、CVRP、VRPTW等)、无人机三维路径规划、无人机协同、无人机编队、机器人路径规划、栅格地图路径规划、多式联运运输问题、车辆协同无人机路径规划、天线线性阵列分布优化、车间布局优化

5 无人机应用方面
无人机路径规划、无人机控制、无人机编队、无人机协同、无人机任务分配

6 无线传感器定位及布局方面
传感器部署优化、通信协议优化、路由优化、目标定位优化、Dv-Hop定位优化、Leach协议优化、WSN覆盖优化、组播优化、RSSI定位优化

7 信号处理方面
信号识别、信号加密、信号去噪、信号增强、雷达信号处理、信号水印嵌入提取、肌电信号、脑电信号、信号配时优化

8 电力系统方面
微电网优化、无功优化、配电网重构、储能配置

9 元胞自动机方面
交通流 人群疏散 病毒扩散 晶体生长

10 雷达方面
卡尔曼滤波跟踪、航迹关联、航迹融合

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值