基于过零率和短时能量的端点侦测
[x,fs,nbits]=wavread('sunday.wav');
x = x / max(abs(x));%幅度归一化到[-1,1]
%参数设置
FrameLen = 256; %帧长
inc = 90; %未重叠部分,这里涉及到信号分帧的问题,在后边再解释。
amp1 = 10; %短时能量阈值
amp2 = 2; %即设定能量的两个阈值。
zcr1 = 10; %过零率阈值
zcr2 = 5; %过零率的两个阈值,感觉第一个没有用到。
minsilence = 6; %用无声的长度来判断语音是否结束
minlen = 15; %判断是语音的最小长度
status = 0; %记录语音段的状态
count = 0; %语音序列的长度
silence = 0; %无声的长度
%计算过零率
tmp1 = enframe(x(1:end-1), FrameLen,inc);
tmp2 = enframe(x(2:end) , FrameLen,inc);
signs = (tmp1.*tmp2)<0;
diffs = (tmp1 - tmp2)>0.02;
zcr = sum(signs.*diffs,2);%虽然没搞懂上边的原理,但是可以推测存的是各桢的过零率。上边计算过零率的放到后边分析,这里只要了解通过这几句得到了信号各帧的过零率值,放到zcr矩阵中。
%计算短时能量
%amp = sum((abs(enframe(filter([1 -0.9375], 1, x), FrameLen, inc))).^2, 2);%不知道这里的filter是干啥的&#