kaldi ASR pipeline涉及到的知识

kaldi中基于决策树的状态绑定

https://blog.csdn.net/asrgreek/article/details/88139638

 

Kaldi学习笔记 -- 构建字典FST脚本 -- prepare_lang.sh 关键内容解析

https://blog.csdn.net/duishengchen/article/details/52473918

 

 

Kaldi 文件打印及其说明(topo文件等说明)

https://blog.csdn.net/qq_25867649/article/details/78435959

 

kaldi中的egs文件夹中的demo都是干什么的

https://blog.csdn.net/yj13811596648/article/details/102744957

 

HMM+GMM语音识别技术详解级PMTK3中的实例

https://blog.csdn.net/fandaoerji/article/details/44853853

 

WFST算法讲解

系列一:

1、https://blog.csdn.net/fengzhou_/article/details/80776805
2、https://blog.csdn.net/fengzhou_/article/details/80778240

3、https://blog.csdn.net/fengzhou_/article/details/80778901

4、https://blog.csdn.net/fengzhou_/article/details/80806392

5、https://blog.csdn.net/fengzhou_/article/details/80835341

系列二:

1、https://blog.csdn.net/l_b_yuan/article/details/50876340

2、https://blog.csdn.net/l_b_yuan/article/details/50890261

3、https://blog.csdn.net/l_b_yuan/article/details/50954425

上面两个系列可以一起看,有的东西讲得不够清楚,互补起来看,更加清楚。

 

 

Kaldi WFST HCLG.fst 构图 学习

https://blog.csdn.net/lucky_ricky/article/details/77511543

 

 

Kaldi学习之数据准备详细解释说明(各个文件的意义)

https://blog.csdn.net/llearner/article/details/77549273

 

 

 

 

其实,最好的工具还是kaldi官网文档(http://www.kaldi-asr.org/doc)的说明,知识学校这个网络太差了,打不开,只能网上进行零碎学习。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Kaldi可以使用多种工具来生成ASR词汇表。其中一种方法是使用Kaldi提供的工具来生成音素级别的词汇表,然后将其转换为单词级别的词汇表。以下是使用Kaldi生成ASR词汇表的步骤: 1. 准备数据:首先,需要准备一个包含训练数据的语料库。这个语料库应该包括音频文件和相应的文本转录。 2. 分词:使用中文分词工具将文本转录分成单独的词语。可以使用jieba或pkuseg等分词工具来执行此操作。 3. 音素级别的词汇表生成:使用Kaldi提供的工具g2p-seq2seq来将每个单词转换为音素序列。g2p-seq2seq是一个基于神经网络的工具,可以根据给定的输入生成音素序列。可以使用如下命令将文本转录文件(transcription.txt)中的每个单词转换为音素序列: ``` cat transcription.txt | awk '{for(i=2;i<=NF;i++) printf "%s ",$i; print ""}' |\ g2p-seq2seq --model models/grapheme2phoneme/seq2seq_cmu_bpe5000.mdl --apply_bpe 5000 > lexicon.tmp ``` 这将生成一个名为lexicon.tmp的文件,其中包含每个单词的音素序列。 4. 单词级别的词汇表生成:使用Kaldi提供的工具phonetisaurus-apply来将音素级别的词汇表转换为单词级别的词汇表。可以使用如下命令将音素级别的词汇表(lexicon.tmp)转换为单词级别的词汇表(lexicon.txt): ``` phonetisaurus-apply --model g2p.fst --word_list lexicon.tmp > lexicon.txt ``` 这将生成一个名为lexicon.txt的文件,其中包含每个单词及其对应的音素序列。 5. 格式转换:将生成的词汇表转换为Kaldi所需的格式。可以使用如下命令将生成的词汇表(lexicon.txt)转换为Kaldi格式的词汇表(lexicon.txtp): ``` utils/prepare_lang.sh --position_dependent_phones false data/local/dict "<unk>" data/local/lang data/lang ``` 这将生成一个名为lexicon.txtp的文件,其中包含Kaldi所需的词汇表格式。 这些步骤将生成一个包含中文单词及其对应的音素序列的词汇表,该词汇表可以用于训练中文ASR系统。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值