自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 临时kaldi 记载

1.final.mdl 声音模型文件 2. HCLG.fst 完全的fst 3. words.txt 发音词典 4. final_mat: 特征的LDA矩阵 5. word_boundary_phones.int: 词对齐时使用的音素分界信息

2017-01-12 11:47:16 511

原创 gentle里面的py文件

diff_align.py 排列工具forced_aligner.py 强制排列full_transcriber.py 转录kaldi_queue.py kaldi队列language_model.py 语言模型metasentence.py 元的句子(造句)multipass.py 多通道resample.py 重采样resources.py

2017-01-11 18:29:13 508

原创 kaldi run.sh 执行

用于公司研究记录#prepare language stuff#build a large lexicon that invovles words in both the training and decoding.(  echo "make word graph ..."  cd $H; mkdir -p data/{dict,lang,graph} && \  cp $

2017-01-11 14:26:45 1444

原创 kaldi文件解释2

test

2017-01-10 16:57:57 788

原创 kaldi解释wav.trn

第一行中文 第二行拼音 第三行音素音素与中文相关 .

2017-01-10 15:35:59 1645

原创 修改kaldi难题

1.解决录音自身的音素填写, 既是 data/phone.txt2.大量资料(基本的词汇因素) , 既是 dict/lexicon.txt 以及 dict/phone.txt

2017-01-05 18:46:35 619

原创 kaldi数据准备部分,文件解释

若想用已识别的系统对你的数据解码,要重写 “数据部分”. 直接以thchs30项目为例里面或许会有cmvn.scp feats.scp reco2file_and_channel segments spk2utt text utt2spk wav.scp文件”text” :包含每段语音的文字意思 每行的第一项是录音编号(utterance-id),发音编号后面跟着的 是每段录音的

2017-01-05 16:41:27 4069

原创 kaldi

第一阶段:./cmd.sh . ./path.sh(设置执行路径以及命令脚本名字)ps:decode 解码 train 训练第二阶段:data preparation(数据准备阶段)执行 local/ thchs-30_data_prep.sh为了创建: wav.scp, utt2spk.scp, spk2utt.scp, text 还有words.txt phone.txt- 循环遍历t

2017-01-05 16:11:34 4154

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除