下载地址:http://download.csdn.net/detail/fzxy002763/4082023
算法不是原创的,由于网上流传版本很多,不过都是独立给出一些m文件,不完整,故笔者整理了一下,调试通过,方便大家学习下dtw算法。
其中dtw_test是测试文件,其他皆为function文件
disp('正在计算参考模板的参数...')
for i=1:5
fname = sprintf('%da.wav',i);
x=fname;
[x,fs]=wavread(x);
[x1 x2] = vad(x);
m = mfcc(x);
m = m(x1-2:x2-2,:);
ref(i).mfcc = m;
% soundview(x);
end
disp('正在计算测试模板的参数...')
for i=1:1
%[x,fs]=wavread('E:\\3.wav')
fname = sprintf('%db.wav',i);
x=fname;
[x,fs]=wavread(x);
[x1 x2] = vad(x);
m = mfcc(x);
m = m(x1-2:x2-2,:);
test(i).mfcc = m;
end
disp('正在进行模板匹配...')
dist = zeros(1,5);
for i=1:1
for j=1:5
dist(i,j) = dtw(test(i).mfcc, ref(j).mfcc);
end
end
disp('正在计算匹配结果...')
for i=1:1
[d,j] = min(dist(i,:));
fprintf('测试模板 %d 的识别结果为:%d\n', i, j);
end
略微改动了下原版,这里两次循环,第一次1~5,主要检索模板,计算梅尔倒普系数等一些声纹特征,然后在第二次循环中进行模板匹配的计算。这里文件命名原则是%da,如1a,1b,测试结果显示为“测试模板%d的识别结果为x”,即意义是哪一个wav文件匹配哪一个文件,如程序测试结果为:
1.vad
2.识别
故是4a.wav匹配1b.wav,可以自行设定理解,PS:录音最好时间差不多,且大于1S,要不然可能会报index exceeds matrix dimensions这种错误。