制作自定义的HCLG模型文件过程中,需要利用srilm库把语言文本文件制作成arpa文件,然后再转为FST文件。
arpa到fst的转换过程中经常会忽视掉一个关键问题,也是Linux和windows下的一个重要差别,就是回车换行符的差别,在linux下只有\r,而在windows下是\r\n两个字符。这样会导致转换失败,或是转换错误。
避免办法:在arpa文件转换之前,先把其中的\n符号都删除掉。
制作自定义的HCLG模型文件过程中,需要利用srilm库把语言文本文件制作成arpa文件,然后再转为FST文件。
arpa到fst的转换过程中经常会忽视掉一个关键问题,也是Linux和windows下的一个重要差别,就是回车换行符的差别,在linux下只有\r,而在windows下是\r\n两个字符。这样会导致转换失败,或是转换错误。
避免办法:在arpa文件转换之前,先把其中的\n符号都删除掉。