![](https://img-blog.csdnimg.cn/20200329215535747.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
Kaldi
文章平均质量分 51
kaldi学习记录
v-space
语音识别、声纹识别、语音唤醒
展开
-
kaldi对齐
一、状态级别对齐ali-to-hmmstate $ali/final.mdl ark:"gunzip -c $ali/ali.*.gz|" ark,t:$ali/states.tra二、音素级别对齐ali-to-phones --per-frame $ali/final.mdl ark:"gunzip -c $ali/ali.*.gz|" ark,t:- \| utils/int2sym.pl -f 2- $lang/phones.txt > $ali/phones.txt三、单词级别对原创 2022-05-16 11:21:45 · 562 阅读 · 5 评论 -
《kaldi语音识别实战》:带特征变换的三音素模型训练——train_lda_mllt.sh,train_sat.sh解析
无监督特征变换差分在一定窗长内,计算前后帧的差分特征补充到当前帧后边。如一个M维的特征做D阶差分后特征维度变为(D+1)*M。# kaldisrc/featbin/add-deltas scp:data/train/feats.acp \ ark,scp:data/trainfeat_delta.ark,data/train/feats_deltas.scp拼帧在一定窗长内,将前后指定帧拼成一帧特征。# kaldisrc/featbin/splice-feats scp:d.原创 2022-04-06 21:02:35 · 2947 阅读 · 0 评论 -
《kaldi语音识别实战》阅读笔记:特征变换
无监督特征变换差分在一定窗长内,计算前后帧的差分特征补充到当前帧后边。如一个M维的特征做D阶差分后特征维度变为(D+1)*M。# kaldisrc/featbin/add-deltas scp:data/train/feats.ark \ ark,scp:data/trainfeat_delta.ark,data/train/feats_deltas.scp拼帧在一定窗长内,将前后指定帧拼成一帧特征。# kaldisrc/featbin/splice-feats scp:d.原创 2022-04-05 11:32:49 · 3298 阅读 · 0 评论 -
《kaldi语音识别实战》阅读笔记:三音素模型训练—train_deltas.sh解析
使用说明:steps/deltas.shUsage: steps/train_deltas.sh <num-leaves> <tot-gauss> <data-dir> <lang-dir> <alignment-dir> <exp-dir>e.g.:steps/train_deltas.sh 2000 10000 data/train_5k data/lang exp/mono_ali exp/tri1 ...原创 2022-04-04 19:57:34 · 2382 阅读 · 0 评论 -
《kaldi语音识别实战》阅读笔记:单音素模型训练—train_mono.sh解析
第一阶段:模型初始化gmm-init-monoInitialize monophone GMM.Usage: gmm-init-mono <topology-in> <dim> <model-out> <tree-out>e.g.: gmm-init-mono topo 40 mono.mdl mono.tree将topo文件和声学特征维度作为输入,则会生成初始声学模型。不需要输入任何训练数据,进初始化一个基础模型。且生成的模型中每个状态只有.原创 2022-04-04 15:13:15 · 2151 阅读 · 0 评论 -
kaldi:计算词错率(WER)
compute-wer --mode=present ark:reference ark:hyps原创 2021-12-27 10:07:30 · 2116 阅读 · 0 评论 -
Kaldi:提特征报错“compute-fbank-feats: error while loading shared libraries: libkaldi-hmm.so”
# 将该命令加入path.sh或者.bashrc中,进而将其加入系统路径export LD_LIBRARY_PATH=/your_path/kaldi/src/lib:/your_path/kaldi/tools/openfst/lib:$LD_LIBRARY_PATH原创 2021-11-24 16:30:26 · 2188 阅读 · 0 评论 -
解决:steps/make_fbank.sh: line 132: run.pl: command not found
问题描述使用kaldi提取特征时,遇到这个问题原因应该时run.pl没有添加到环境变量里边首先,定位run.pl命令所在位置:locate run.pl找出run.pl路径如下所示:将第一行路径加入到运行时的环境变量里边:export PATH=$PWD/utils/#$PWD为当前目录,默认其包含utils软连接到wsj的utils里即可解决。...原创 2020-09-27 11:52:15 · 1092 阅读 · 0 评论 -
解决kaldi检查utt2spk出错:fix this by making speaker-ids prefixes of utt-ids
出错:原因在实验fix_data_dir.sh工具包检查数据准备文件夹中的utt2spk出错,这是由于准备utt2spk文件的uttid前缀不是spkid。如:文件中内容(uttid spkid)为:str1_str2_str3 str2解决办法将内容(uttid spkid)改为:str1_str2_str3 str1_str2即可...原创 2020-08-29 16:25:39 · 861 阅读 · 1 评论 -
语音数据增强—使用kaldi对语音加噪
wav-reverberate --additive-signals="sox noise.wav -r 16000 -t wav -|" \ --start-times='0' --snrs='10.0' \ source.wav dest.wav–start-time:添加噪音起始时间–snrs: 信噪比,越大噪音越小参考:MUSAN [论文]...原创 2020-04-10 12:07:15 · 2002 阅读 · 0 评论 -
Linux kaldi安装教程
环境:Linux1.下载kaldigit clone https://github.com/kaldi-asr/kaldi.git2.进入到kaldi/tools目录make -j 4可以根据CPU核心数调整,越大运行越快。(如果没有提前安装好依赖包,则会报错。根据提示安装依赖。)3.进入到kaldi/src目录./configuremake dependmake -j...原创 2020-03-28 21:00:27 · 2253 阅读 · 1 评论 -
解决Bad perplexities . at /home/work/kaldi/tools/kaldi_lm/optimize_alpha.pl line 30
问题:kaldi在训练语言模型时出现以下错误:Not creating raw N-gram counts ngrams.gz and heldout_ngrams.gz since they already exist in data/local/lm/3gram-mincount(remove them if you want them regenerated)Iteration ...原创 2020-03-27 12:33:38 · 668 阅读 · 2 评论 -
解决ERROR: text file '***' contains disallowed UTF-8 whitespace character(s)
问题:ERROR: text file 'data/train/text' contains disallowed UTF-8 whitespace character(s)解决方法:cat data/train/text |tr -d '/r'原创 2020-03-24 09:52:17 · 1667 阅读 · 0 评论