1. stage 1
在此之前,已经下载了130G的AMI数据在目录$AMI_DIR(wav_db/amicorpus)了。
# Prepare ihm data directories,
if [ $stage -le 1 ]; then
local/ami_ihm_data_prep.sh $AMI_DIR
local/ami_ihm_scoring_data_prep.sh $AMI_DIR dev
local/ami_ihm_scoring_data_prep.sh $AMI_DIR eval
fi
ami_ihm_data_pre.sh脚本内部流程如下:
1) 在data/local/ihm/train文件夹下准备各种文件,如wav.scp;
2) 拷贝spk2utt utt2spk wav.scp text segments reco2file_and_channel到data/ihm/train文件夹中。
3) 检查文件格式:
utils/validate_data_dir.sh --no-feats data/ihm/train || exit 1;
ami_ihm_scoring_data_prep.sh内部流程和ami_ihm_data_pre.sh类似,只是处理的是
dev和
eval<