若想用已识别的系统对你的数据解码,要重写 “数据部分”.
直接以thchs30项目为例
里面或许会有
cmvn.scp feats.scp reco2file_and_channel segments spk2utt text utt2spk wav.scp
文件”text” :包含每段语音的文字意思
每行的第一项是录音编号(utterance-id),
发音编号后面跟着的 是每段录音的标注。
文件wav.scp
这个文件的格式是
<recording-id> <extended-filename>
大家可以理解为是一段提取wav格式文件的命令。
文件”utt2spk”与”spk2utt”
spk2utt文件格式是:
<speak