kaldi
少游223
语音识别算法
展开
-
Decoding-graph creation recipe (training time) (kaldi翻译+个人理解)
kaldi的图创建过程在训练阶段与测试阶段相比而言要相对简单一点,主要是因为不需要消歧符号,我们假定你已经读了这个recipe的test阶段,然而我没读,,,。在训练过程中我们采用和test阶段相同的HCLG形式,除了G是由一个符合训练transcript的linear acceptor(当然这个setup和容易扩展到transciptes中的不确定情况)Command-line prog...原创 2019-11-25 17:10:17 · 438 阅读 · 0 评论 -
Decoding graph construction in Kaldi(kaldi翻译+个人理解)
kaldi英文链接:http://www.kaldi-asr.org/doc/graph.html本系列的文章是自己从kaldi中挑选按有助于理解整个流程的部分,不知道能坚持多久,It is never too late to learn.这是我刚到TEG办公室看到的,阴错阳差此刻又出现在我面前,或许是在提醒我不要忘记它。Overview of graph creation: 整个的...原创 2019-11-08 09:58:54 · 336 阅读 · 0 评论 -
Feature extraction (kaldi 翻译+个人理解)
kaldi原文地址:http://www.kaldi-asr.org/doc/feat.htmlIntroduction:我们的特征抽取和读波形的代码旨在创建标准的MFCC和PLP特征,在程序中已经设置好合理的默认值并且还留下了可选择项使用户可以适度调整,比如mel bins的数目,频率截断值得最大值和最小值。这个代码值读包含pcm数据的wav文件。这些文件普遍都有wav和pcm的后缀(尽...原创 2019-11-07 14:12:31 · 1071 阅读 · 0 评论