区分性训练一般用于大词汇量连续语音识别,在HTK中有一整套训练流程(具体可参阅HTKBook v3.4.1 p55-58)。通常而言,30个小时区分语料即可看到提升效果。
如果使用HTK做DT训练一般可分五步走。
第一步:训练一个最大似然(ML)的词间模型;
第二步:训练一个语言模型,一般而言,一元语言模型就已足够。语言模型的训练文本完全来自你用于区分训练的语料的标注文本。
第三步:创建词级的lattice;
第四步:创建音素级的lattice
第五步:迭代训练。在这一步之前要注意检查上一步训练产生的lattice,如果生成的lattice有问题,可能会导致迭代失败。