这篇文章是根据yesno样例下的run.sh脚本写出来的,当然脚本里还有许多附带工具暂时就来不及一一详解,看以后有没有时间和兴趣了。
1.
train_cmd="utils/run.pl"
decode_cmd="utils/run.pl"
定义机器运作方式,这里是本地多任务处理工作方式,而不是gpu.
2.
if [ ! -d waves_yesno ]; then
wget http://www.openslr.org/resources/1/waves_yesno.tar.gz || exit 1;
# was:
# wget http://sourceforge.net/projects/kaldi/files/waves_yesno.tar.gz || exit 1;
tar -xvzf waves_yesno.tar.gz || exit 1;
fi
train_yesno=train_yesno
test_base_name=test_yesno
判断是否有yesno音频,有的话直接解压,没有的话,下载再解压;命名训练集和测试集。
3.
local/prepare_data.sh waves_yesno
local/prepare_dict.sh
utils/prepare_lang.sh --position-dependent-phones false data/local/dict "<SIL>" data/local/lang data/lang
local/prepare_lm.sh
根据音频,准备适应kaldi框