ASR
文章平均质量分 58
SpeechScience
这个作者很懒,什么都没留下…
展开
-
Kaldi-Running the example scripts
(1) 特征: 提取:steps/make_mfcc.sh --nj 8 --cmd "run.pl" data/$x exp/make_mfcc/$x $featdir; 查看:copy-feats ark:$featdir/raw_mfcc_train.1.ark ark,t:- | head (2) 模型: 训练:steps/train_mono.sh --nj 4 --c原创 2015-08-24 10:34:24 · 1030 阅读 · 0 评论 -
如何用kaldi训练好的DNN模型做在线识别
在已经训练好模型的情况下,需要针对一个新任务做在线识别应该怎么做呢? 一种情况是,用已有的声学模型和新训练的语言模型。 语言模型可以同srilm等工具训练,但是怎样将语言模型与DNN声学模型一起来进行识别的。 SRILM可以用来训练ARPA格式的LM,假设train.txt是语料,wordlist是词汇,假设语言模型的字典和识别器的字典一样,可以按如下办法训练LM ngram-coun原创 2016-10-11 17:46:55 · 8102 阅读 · 3 评论 -
端到端语音识别系统
本文主要观点来自于 google论文。 Towards End-to-EndSpeech RecognitionUsing Deep Neural Networks。 问题背景: 传统语音识别系统需要经过提特征,声学建模(state-phoneme-triphone),语言建模系列过程,其中声学建模需要对上下文相关的音素模型进行状态聚类,对每一帧特征需要做对齐。 端到端系统主要提出了下面的原创 2016-10-11 16:13:55 · 9154 阅读 · 1 评论