kaldi源码分析(一)--kaldi脚本

最新推荐文章于 2024-01-05 15:40:35 发布

执刀人

最新推荐文章于 2024-01-05 15:40:35 发布

阅读量1.2k

点赞数

分类专栏：语音识别文章标签： kaldi

本文链接：https://blog.csdn.net/u012528143/article/details/89673804

版权

语音识别专栏收录该内容

9 篇文章 3 订阅

订阅专栏

文章目录

数据准备

发音词典 L.fst

将之前的词典转换为L.fst 以及 topo文件

utils/prepare_lang.sh --position-dependent-phones false lang/dict “<UNK>” lang/local lang/lang

提取特征

脚本	使用
steps/make_mfcc.sh	根据wav.scp提取特征
steps/compute_cmvn_stats.sh	根据feats.scp计算cmn

声学模型训练

脚本	作用
steps/train_mono.sh	单音素训练，一共进行40次迭代，每两次迭代进行一次对齐操作
steps/train_deltas.sh	以单音素模型为输入训练上下文相关的三音素模型
steps/train_lda_mllt.sh	用来进行线性判别分析和最大似然线性转换
steps/train_sat.sh	用来训练发音人自适应，基于特征空间最大似然线性回归
steps/nnets	nnet3神经网络

脚本	作用
utils/format_lm.sh	上述的语言工具基于第三方工具，为ARPA-format,脚本的作业是将其转换为fst，方便与之前的字典fst(L.fst)结合，发挥fst的优势。脚本最后会检测G.fst中是否存在没有单词的空回环，如果存在会报错，因为这会导致后续HLG determinization的出现错误。脚本utils/format_lm.sh解决把ARPA格式的语言模型转换成OpenFST格式类型。
utils/fix_data_dir.sh	该脚本会修复排序错误，并会移除那些被指明需要特征数据或标注，但是却找不到被需要的数据的那些发音

脚本

作用

utils/format_lm.sh

上述的语言工具基于第三方工具，为ARPA-format,脚本的作业是将其转换为fst，方便与之前的字典fst(L.fst)结合，发挥fst的优势。脚本最后会检测G.fst中是否存在没有单词的空回环，如果存在会报错，因为这会导致后续HLG determinization的出现错误。脚本utils/format_lm.sh解决把ARPA格式的语言模型转换成OpenFST格式类型。

utils/fix_data_dir.sh

该脚本会修复排序错误，并会移除那些被指明需要特征数据或标注，但是却找不到被需要的数据的那些发音