kaldi 在线解码时报错 dimension mismatch 39 vs. 40

在使用Kaldi的online-wav-gmm-decode-faster工具处理CSJ日语数据集时,遇到维度不匹配错误(39 vs. 40)。问题源于特征增强过程中应用了LDA+MLLT(包括STC和fMLLR)变换,导致模型从39维变为40维。解决方案是在解码时提供相应的特征变换矩阵final.mat,以避免维度不匹配的问题。
摘要由CSDN通过智能技术生成

问题描述

kaldi中用 online-wav-gmm-decode-faster 对单一wav文件解码时报出如下错误:

online-wav-gmm-decode-faster --verbose=1 --rt-min=0.8 --rt-max=0.85 --max-active=4000 --beam=12.0 --acoustic-scale=0.0769 scp:./work/input.scp online-data/models/tri4/model online-data/models/tri4/HCLG.fst online-data/models/tri4/words.txt 1:2:3:4:5 ark,t:./work/trans.txt ark,t:./work/ali.txt
File: A01M0097
ERROR (online-wav-gmm-decode-faster[5.5]:LogLikelihoods():diag-gmm.cc:533) DiagGmm::LogLikelihoods, dimension mismatch 39 vs. 40

核心问题是GMM模型的维数不匹配


原因分析

我这里用的是CSJ日语数据集,一开始用tri1,也就是三音子triphone模型解码时没有问题,因为在三音子模型中特征一直是39维,用gmm-info 查看exp/tri1 下的模型文件final.mdl时也会发现

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值