kaldi学习
郑郑yay
这个作者很懒,什么都没留下…
展开
-
Kaldi 提取40维MFCC
# config for high-resolution MFCC features, intended for neural network training. # Note: we keep all cepstra, so it has the same info as filterbank features, # but MFCC is more easily compressible (because less correlated) which is why # we prefer this me原创 2021-04-28 13:19:19 · 269 阅读 · 0 评论 -
Rescoring
思路: 使用小的构建,然后使用来构建静态图,然后使用小的和大的来构建(中的权重为的权重减去的权重)解码时根据和的使用方式,又可以细分: 常规的Rescoring:利用先全部解码,生成词图或者N-best,然后在上做词图和N-best的Rescoring on-the-fly Rescoring:使用做解码,在解码过程中,每当解码出的word时,立即加上中权重,完成实时的Rescoring。 ...原创 2021-03-11 22:09:23 · 186 阅读 · 0 评论 -
kaldi例子thchs30笔记(二)
数据准备 由于我们已经下载过数据了,直接进行数据准备。 根据注释,我们知道,数据准备就是要产生四个文件分别是text,wav.scp,utt2pk,spk2utt 打开s5/local/thchs-30_data_prep.sh原创 2021-03-11 13:24:59 · 539 阅读 · 1 评论 -
kaldi例子thchs30笔记(一)
thchs30数据集是清华大学30小时的中文数据集可以在http://www.openslr.org/18/上下载。 一、数据准备 首先你需要下载语料库: data_thchs30.tgz [6.4G] ( speech data and transcripts ) test-noise.tgz [1.9G] ( standard 0db noisy test data ) resource.tgz [24M] ( supplementary resources, incl. lexicon for原创 2021-03-10 14:26:25 · 650 阅读 · 0 评论