语音识别
执刀人
这个作者很懒,什么都没留下…
展开
-
kaldi部分训练方法DNN-HMM模型
kaldi部分训练方法-REVERB语料DNN-HMM模型语音识别框架都是基于GMM-HMM的,然而浅层的模型结构的建模能力有限,不能捕捉获取数据特征之间的高阶相关性。而DNN-HMM系统利用DNN很强的表现学习能力,再配合HMM的系列化建模能力,在很多大规模语音识别任务中都超过了GMM模型。下图给出一个DNN-HMM系统的结构图。在这个框架中,HMM用来描述语音信号的动态变化,用...转载 2018-08-03 18:37:31 · 7825 阅读 · 2 评论 -
基于srilm的语言模型训练简介(一)
文章目录一、语言模型训练二、语言模型打分三、语言模型剪枝四、语言模型合并五、语言模型使用词典限制一、语言模型训练##功能#读取分词后的text文件或者count文件,然后用来输出最后汇总的count文件或者语言模型##参数#输入文本:# -read 读取count文件# -text 读取分词后的文本文件#词典文件:# -vocab 限制text和count文件的单词,没有出...原创 2019-09-28 22:00:56 · 1189 阅读 · 1 评论 -
kaldi源码分析(零)--kaldi的安装
文章目录kaldi安装kaldi安装sudo apt-get updatesudo apt-get upgradesudo apt-get install gitsudo apt-get install -y git wget libatlas-dev libatlas-base-dev gfortran g++ zlib1g-dev autoconf automake gcc lib...原创 2019-09-11 12:52:21 · 674 阅读 · 0 评论 -
kaldi源码分析(四)-单音素训练
文章目录steps/train_mono.shsteps/train_mono.sh单音素训练是使用kaldi进行所有传统声学模型训练的起始部分,尤为重要。在进行声学模型训练时,首先使用单高斯模型进行模型训练。声学模型的对齐就是进行数据的标注,以英文识别为例,数据的标注指的是将每一帧所表示的音素进行标记。下面就讲一下训练的过程:首先是初始化GMM,使用的脚本是/kaldi/src/gm...原创 2019-09-03 11:54:17 · 543 阅读 · 0 评论 -
kaldi源码分析(三)-特征处理
文章目录原创 2019-05-10 00:58:30 · 2602 阅读 · 0 评论 -
kaldi源码分析(二)-数据准备
文件名称内容格式text< uttid > < word >wav.scp< uttid > < utter_file_path >utt2spk< uttid > < speakid >spk2utt< speakid > < uttid >segm...原创 2019-05-05 22:56:29 · 1113 阅读 · 0 评论 -
kaldi源码分析(一)--kaldi脚本
kaldi源码分析-scripts level数据准备声学模型训练语言模型训练解码原创 2019-04-30 14:43:12 · 1330 阅读 · 0 评论 -
语音识别框架原理简述
欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键斜体 Ctrl + I 引用 Ctrl + Q翻译 2018-08-03 16:02:43 · 13409 阅读 · 1 评论 -
FBank与MFCC
预处理分帧我们需要将不定长的音频切分成固定长度的小段,这一步称为分帧。一般取10-...转载 2019-09-28 23:22:55 · 1342 阅读 · 0 评论