1 简介
本文在分析基本谱熵端点检测算法局限的基础上,引入基于二阶累积量的门限更新方法,加入短时能量参数,提出基于加权谱熵的检测方法;此外,引入特征空间能量熵定义,建立新的门限确定准则,提出基于特征空间能量熵的检测方法.通过对平稳高斯白噪声,M109坦克噪声和F16战斗机噪声这三种典型噪声环境下信噪比(SNR)从-5dB到20dB的带噪语音信号进行的仿真实验分析表明,所提两种方法能更为准确地检测到语音的端点.
2 部分代码
%谱熵端点检测F1_002.wav,enframe.m放在当前路径
clear all;
[x,fs,bits]=wavread('F1_002.wav');
sound(x,fs)
x=filter([1 -0.95],1,x);%对语音进行预加重,x[n]=y[n]-0.95y[n-1]
L=320; %窗长
FrameLen=320;
FrameInc=160;
%[f]=enframe(x,hamming(320,'periodic'),FrameInc);%加汉明窗
[framenum,f]=enframe(x,FrameLen,FrameInc);
%[framenum,L]=size(f);%显示帧数
P=framenum;%总帧数
%求每帧的谱熵,用数组H存储,第i个元素为第i帧的谱熵
for ii=1:P
s=f(ii,:);% 取出第ii帧语音样值
S=abs(fft(s));%该帧的幅度频谱
S=S(1:FrameLen/2);%取正频率成分,即频谱左边那部分
E=S.*S;%计算每条谱线分量的能量谱,E是长度为FrameLen/2的数组
Prob=E/sum(E);%计算每条谱线的概率密度,Prob是长度为FrameLen/2的数组
H(ii)=-sum(Prob.*log(Prob+eps));%计算每帧的谱熵
end
%%%观察
frameTime=(((1:P)-1)*FrameInc+FrameLen/2)/fs;%
%frameTime是数组,长度为帧长,第i个元素值是第i帧中间那个样值对应的时间
figure
subplot(2,1,1)
plot((0:length(x)-1)/fs,x);
xlabel('时间/s');ylabel('幅度');title('语音信号');
subplot(2,1,2)
plot(frameTime,H);%画出各帧的谱熵值,从而预估起点和终点的帧序号及MR1,MR2大小
xlabel('时间/s');ylabel('幅度');title('谱熵值');
%%%%取前导帧的谱熵值的平均值
MR=mean(H(1:5));% 取1-5帧做背景噪声的谱熵的平均值
MR1=1.001*MR;
MR2=0.895*MR;
cx1=0;%检测出的起点帧号
cx2=0;%检测出的终点帧号
flag1=0;
flag2=0;
for i=1:P-3
if (H(i)<MR1)&&(H(i+1)<MR1)&&(H(i+2)<MR1)&&(H(i+3)<MR1)&&(flag1==0)
cx1=i;
flag1=1;
end
end
for i=cx1+1:P-3
if (H(i)>MR2)&&(H(i+1)>MR2)&&(H(i+2)>MR2)&&(H(i+3)>MR2)&&(flag2==0)
cx2=i-1;
flag2=1;
end
end
cx1
cx2
frameTime(cx1)
frameTime(cx2)
figure%显示图形
subplot(211),plot((0:length(x)-1)/fs,x);
title('语音波形');
xlabel({'时间/s' ; '(a)'});
ylabel('幅度');
line([frameTime(cx1),frameTime(cx1)],[min(x),max(x)],'color','r');
line([frameTime(cx2),frameTime(cx2)],[min(x),max(x)],'color','r');
subplot(212),plot(frameTime,H);
title('谱熵值');
xlabel({'时间/s' ; '(b)'});
ylabel('谱熵值');
line([frameTime(cx1),frameTime(cx1)],[min(H),max(H)],'color','r');
line([frameTime(cx2),frameTime(cx2)],[min(H),max(H)],'color','r');
%%%%%%思考:带噪情况下效果如果?换别的语音效果如何?
3 仿真结果
4 参考文献
[1]王博, 郭英, 韩立峰. 基于熵函数的语音端点检测算法研究[J]. 信号处理, 2009, 25(3):6.
博主简介:擅长智能优化算法、神经网络预测、信号处理、元胞自动机、图像处理、路径规划、无人机等多种领域的Matlab仿真,相关matlab代码问题可私信交流。
部分理论引用网络文献,若有侵权联系博主删除。