问题描述
kaldi中用 online-wav-gmm-decode-faster 对单一wav文件解码时报出如下错误:
online-wav-gmm-decode-faster --verbose=1 --rt-min=0.8 --rt-max=0.85 --max-active=4000 --beam=12.0 --acoustic-scale=0.0769 scp:./work/input.scp online-data/models/tri4/model online-data/models/tri4/HCLG.fst online-data/models/tri4/words.txt 1:2:3:4:5 ark,t:./work/trans.txt ark,t:./work/ali.txt
File: A01M0097
ERROR (online-wav-gmm-decode-faster[5.5]:LogLikelihoods():diag-gmm.cc:533) DiagGmm::LogLikelihoods, dimension mismatch 39 vs. 40
核心问题是GMM模型的维数不匹配
原因分析
我这里用的是CSJ日语数据集,一开始用tri1,也就是三音子triphone模型解码时没有问题,因为在三音子模型中特征一直是39维,用gmm-info 查看exp/tri1 下的模型文件final.mdl时也会发现