2017年01月_dzp443366

原创临时kaldi 记载

1.final.mdl 声音模型文件 2. HCLG.fst 完全的fst 3. words.txt 发音词典 4. final_mat: 特征的LDA矩阵 5. word_boundary_phones.int: 词对齐时使用的音素分界信息

2017-01-12 11:47:16 511

原创 gentle里面的py文件

diff_align.py 排列工具forced_aligner.py 强制排列full_transcriber.py 转录kaldi_queue.py kaldi队列language_model.py 语言模型metasentence.py 元的句子(造句)multipass.py 多通道resample.py 重采样resources.py

2017-01-11 18:29:13 508

原创 kaldi run.sh 执行

用于公司研究记录#prepare language stuff#build a large lexicon that invovles words in both the training and decoding.( echo "make word graph ..." cd $H; mkdir -p data/{dict,lang,graph} && \ cp $

2017-01-11 14:26:45 1444

原创 kaldi文件解释2

test

2017-01-10 16:57:57 788

原创 kaldi解释wav.trn

第一行中文第二行拼音第三行音素音素与中文相关 .

2017-01-10 15:35:59 1645

原创修改kaldi难题

1.解决录音自身的音素填写，既是 data/phone.txt2.大量资料(基本的词汇因素) ，既是 dict/lexicon.txt 以及 dict/phone.txt

2017-01-05 18:46:35 619

原创 kaldi数据准备部分,文件解释

若想用已识别的系统对你的数据解码，要重写 “数据部分”. 直接以thchs30项目为例里面或许会有cmvn.scp feats.scp reco2file_and_channel segments spk2utt text utt2spk wav.scp文件”text” :包含每段语音的文字意思每行的第一项是录音编号（utterance-id），发音编号后面跟着的是每段录音的

2017-01-05 16:41:27 4069

原创 kaldi

第一阶段:./cmd.sh . ./path.sh(设置执行路径以及命令脚本名字)ps:decode 解码 train 训练第二阶段:data preparation(数据准备阶段)执行 local/ thchs-30_data_prep.sh为了创建: wav.scp, utt2spk.scp, spk2utt.scp, text 还有words.txt phone.txt- 循环遍历t

2017-01-05 16:11:34 4154

dzp443366的专栏