matlab DTW语音识别算法调试

下载地址:http://download.csdn.net/detail/fzxy002763/4082023

算法不是原创的,由于网上流传版本很多,不过都是独立给出一些m文件,不完整,故笔者整理了一下,调试通过,方便大家学习下dtw算法。

其中dtw_test是测试文件,其他皆为function文件

disp('正在计算参考模板的参数...')
for i=1:5
	fname = sprintf('%da.wav',i);
	x=fname;
    [x,fs]=wavread(x);
	[x1 x2] = vad(x);
	m = mfcc(x);
	m = m(x1-2:x2-2,:);
	ref(i).mfcc = m;
   % soundview(x);
end

disp('正在计算测试模板的参数...')
for i=1:1
    %[x,fs]=wavread('E:\\3.wav')
	fname = sprintf('%db.wav',i);
	x=fname;
    [x,fs]=wavread(x);    
	[x1 x2] = vad(x);
	m = mfcc(x);
	m = m(x1-2:x2-2,:);
	test(i).mfcc = m;
end

disp('正在进行模板匹配...')
dist = zeros(1,5);
for i=1:1
for j=1:5
	dist(i,j) = dtw(test(i).mfcc, ref(j).mfcc);
end
end

disp('正在计算匹配结果...')
for i=1:1
	[d,j] = min(dist(i,:));
	fprintf('测试模板 %d 的识别结果为:%d\n', i, j);
end
略微改动了下原版,这里两次循环,第一次1~5,主要检索模板,计算梅尔倒普系数等一些声纹特征,然后在第二次循环中进行模板匹配的计算。这里文件命名原则是%da,如1a,1b,测试结果显示为“测试模板%d的识别结果为x”,即意义是哪一个wav文件匹配哪一个文件,如程序测试结果为:

1.vad


2.识别


故是4a.wav匹配1b.wav,可以自行设定理解,PS:录音最好时间差不多,且大于1S,要不然可能会报index exceeds matrix dimensions这种错误。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值