Alize说话人识别工具箱使用的是语音信号处理工具SPro进行mfcc特征提取,对于WAV格式的音频,mfcc特征提取命令为:
bin/sfbcep -m -k 0.97 -p19 -n 24 -r 22 -e -D -A -F wave test.wav test.tmp.prm
保存的mfcc特征文件test.tmp.prm,前10个字节是非特征信息,每一帧的特征维度为60,读取代码如下:
% sproread.m
function [data] = sproread(filename)
% reads features with SPro format
%
fid = fopen(filename, 'rb');
fseek(fid, 10, 'bof');
data = fread(fid, [60,Inf], 'float');
fclose(fid);
声纹识别交流QQ群:875705987