输入:data/local/dict
输出:data/lang (Phone Sets), (L compilation) ...
可选参数:
- --num-sil-states <number of states> (静音音素的状态数,预设是5)
- --num-nonsil-states <number of states>(非静音音素的状态数,预设是3)
- --position-dependent-phones (true|false)(是否开启音素位置标记)
- --share-silence-phones (true|false)(预设为false,如果为true 所有“silence”音素(比如静音,发声噪声和笑声)的高斯混合模型的概率密度函数都是共享的,只有这些模型之间的转移概率不同)
- --sil-prob <probability of silence> (静音的概率,预设是0.5)
- --phone-symbol-table <filename> (是否有自己提供的phone.txt)
- --unk-fst <text-fst> (是否有集外词的fst)
- --extra-word-disambig-syms <filename> (是否有额外的词级别的消歧符)
utils/prepare_lang.sh --position-dependent-phones false data/local/dict "<UNK>" data/local/lang data/lang || ex