Kaldi运行过程中遇到的一些问题(持续更新...)

版权声明:本文为博主原创文章,遵循 CC 4.0 by-sa 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/llearner/article/details/77570219

Q: qsub command not found
A: 这个看错误重定向,如果是queue任务提交失败,需要考虑当前是否为单cpu,无cuda gpu等环境,去cmd.sh查看配置是否达到要求

Q:Karel和Dan的DNN问题
A:Karel的DNN(nnet)不支持CPU,Dan的DNN(nnet2)支持CPU,可以在虚拟机上跑

Q:如何查看DNN和HMM模型二进制文件
A:nnet-am-copy –binary=false final.mdl final.mdl.txt 或者
gmm-copy –binary=false final.mdl final.mdl.txt 或者
nnet3-am-copy –binary=false final.mdl final.mdl.txt
根据模型文件的类型对应选择脚本

Q:自己在准备yesno脚本时,如果将utterance-id写成spkid-uttid格式,不管spkid是否同一人的id,不管arpa是否自己生成,都会导致识别率无法达到100%
A:改成uttid而不是spkid-uttid就不会出现这样的问题,这个可能得查看源码才能发现如何处理的,猜测可能在将spkid-uttid转换成int时出现一些差错?或者与cmvn也有一小部分关系?

Q:cmvn对语音如何处理?
A:cmvn是把特征规整成均值为0,方差为1的向量。
这个是针对 相同的spkid 进行规整的。
x = (x-u)/delta 这样规整
一般来说,cmn和cvn是在一条语音内进行规整(对于多个说话人,cmvn是在同一个说话人内进行规整的,所以如果实际语音有多个说话人,但是标注只有一个说话人,那么cmvn可能会不准确)

Q:如何设置需要打开的默认程序(比如想用sublime而不是gedit打开kaldi脚本)
A:/usr/share/applications里面有安装的程序完整包名
该目录下还有个default.list,把里面对应的包名改成自己想要设置的程序包名即可

展开阅读全文

没有更多推荐了,返回首页