接触语音识别以来,从看文献开始了解语音识别是怎么一回事,它的基本原理、背景、识别流程等等…
现在要用Kaldi进行语音识别真的可以称上小白了,关于文档解读,仅供大家参考。
【以下为Kaldi官方文档目录及内容】
3 kaldi 的使用
3.1 总述
在跑 kaldi 里的样例时,你需要注意三个脚本:cmd.sh path.sh run.sh。下
面分别来说,
- Cmd.sh 脚本为:
【
“queue.pl” uses qsub. The options to it are
options to qsub. If you have GridEngine installed, # change this to a queue you have access to. # Otherwise, use “run.pl”, which will run jobs locally
(make sure your --num-jobs options are no more than
#the number of cpus on your machine.
- #a)
JHU cluster options
#export train_cmd=“queue.pl -l arch=*64” #export decode_cmd=“queue.pl -l arch=*64,mem_free=2G,ram_free=2G” #export mkgraph_cmd=“queue.pl -l arch=*64,ram_free=4G,mem_free=4G” #export cuda_cmd=run.pl
- #b)
BUT cluster options
#export train_cmd=“queue.pl -q all.q@@blade -l
ram_free=1200M,mem_free=1200M” #export decode_cmd=“queue.pl -q all.q@@blade -l
ram_free=1700M,mem_free=1700M” #export decodebig_cmd=“queue.pl -q all.q@@blade -l
ram_free=4G,mem_free=4G” #export cuda_cmd=“queue.pl -q long.q@@pco203 -l gpu=1” #export cuda_cmd=“queue.pl -q long.q@pcspeech-gpu” #export mkgraph_cmd=“queue.pl -q all.q@@servers -l
ram_free=4G,mem_free=4G”
- #c)
run it locally… export train_cmd=run.pl
export decode_cmd=run.pl
export cuda_cmd=run.pl
export mkgraph_cmd=run.pl
】
大家可以很清楚的看到有 3 个分类分别对应 a,b,c。a 和 b 都是集群上去运
行这个样子,c 就是我们需要的。我们在虚拟机上运行的。你需要修改这个脚本。
- Path.sh 的内容:
export KALDI_ROOT=pwd
/…/…/… export
PATH= P W D / u t i l s / : PWD/utils/: PWD/utils/:KALDI_ROOT/src/bin: K A L D I R O O T / t o o l s / o p e n f s t / b i n : KALDI_ROOT/tools/openfst/bin: KALDIROO