主要参考资料 speech recognition with weighted finate-state tra
WFST简单笔记(一)
WFST(weighted finaite-state transducer)用于大规模的语音识别,包括HMM模型,词典,n-gram语言模型。
WFST状态转换用输入和输出符号标记。 因此,transducer将路径编码从输入符号序列或字符串到输出字符串的映射。WFST除了输入和输出符号之外还对转换进行加权。 权重可以编码概率,持续时间,惩罚或沿路径积累的任何其他数量,以计算将输入字符串映射到输出字符串的总体权重。 因此,加权传感器是表示在语音处理中流行的概率有限状态模型的自然选择。
总述
1.WFSA
WFSA(weighted finitestate acceptors),可以识别从初始状态到结束状态的一整条路径
图1a是简单的有限状态的语言模型,每条路径上都有相应的词串和转移概率,图1b则是一个完整的词,图1c显示了一个音素的HMM模型
2.WFST
WFST和WFSA十分相似,区别在于每个转移上都有输入标签,输出标签和相应的权重