- 利用语言模型重打分的时候,使用的语言模型中的词必须包含在词典当中
- 在语音识别中,词网格是识别结果的一种比较紧凑的表示形式,可以用较少的存储空间来表示较多的识别结果。在实际的语音识别系统中,最优路径不一定与实际字序列匹配,我们一般希望能够得到得分最靠前的多条候选路径,即N-best。为了紧凑地保存候选路径,防止占用过多内存空间,我们一般采用词格(Lattice)来保存识别的候选序列。词格没有一般的定义,常用的方法是利用有限状态自动机的数据结构来构建词格。
- lattice-to-phone-lattice.cc 这个函数能够将输出端的单词或保存的transition-id序列转换成phone序列,phone由transition-id计算出来。如果–replace words=true(默认为true),则用phones替换单词,否则替换transition-id序列。这边的的理解是,transition-id能够推出单词,transition-id能够推出phone,然后我们这个文件的功能就是将transition-id(保存的序列,不是输入端!!)或者单词(输出端)替换成phone。如果–replace words=false,则可以得到对应于lattice中每个单词的phones。replace=true,也就是替换输出端的单词为phone;replace=false,也就是替换transition-id序列为phone序列。只能说换了一种表现形式,并进行任何解码过程。