- 博客(8)
- 收藏
- 关注
原创 临时kaldi 记载
1.final.mdl 声音模型文件 2. HCLG.fst 完全的fst 3. words.txt 发音词典 4. final_mat: 特征的LDA矩阵 5. word_boundary_phones.int: 词对齐时使用的音素分界信息
2017-01-12 11:47:16 520
原创 gentle里面的py文件
diff_align.py 排列工具forced_aligner.py 强制排列full_transcriber.py 转录kaldi_queue.py kaldi队列language_model.py 语言模型metasentence.py 元的句子(造句)multipass.py 多通道resample.py 重采样resources.py
2017-01-11 18:29:13 522
原创 kaldi run.sh 执行
用于公司研究记录#prepare language stuff#build a large lexicon that invovles words in both the training and decoding.( echo "make word graph ..." cd $H; mkdir -p data/{dict,lang,graph} && \ cp $
2017-01-11 14:26:45 1459
原创 修改kaldi难题
1.解决录音自身的音素填写, 既是 data/phone.txt2.大量资料(基本的词汇因素) , 既是 dict/lexicon.txt 以及 dict/phone.txt
2017-01-05 18:46:35 630
原创 kaldi数据准备部分,文件解释
若想用已识别的系统对你的数据解码,要重写 “数据部分”. 直接以thchs30项目为例里面或许会有cmvn.scp feats.scp reco2file_and_channel segments spk2utt text utt2spk wav.scp文件”text” :包含每段语音的文字意思 每行的第一项是录音编号(utterance-id),发音编号后面跟着的 是每段录音的
2017-01-05 16:41:27 4134
原创 kaldi
第一阶段:./cmd.sh . ./path.sh(设置执行路径以及命令脚本名字)ps:decode 解码 train 训练第二阶段:data preparation(数据准备阶段)执行 local/ thchs-30_data_prep.sh为了创建: wav.scp, utt2spk.scp, spk2utt.scp, text 还有words.txt phone.txt- 循环遍历t
2017-01-05 16:11:34 4189
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人