Kaldi
snowdroptulip
菜鸟
展开
-
Kaldi学习笔记(三)——运行thchs30(清华大学中文语料库)
Kaldi中文语音识别公共数据集一共有4个(据我所知),分别是:1.aishell: AI SHELL公司开源178小时中文语音语料及基本训练脚本,见kaldi-master/egs/aishell2.gale_mandarin: 中文新闻广播数据集(LDC2013S08, LDC2013S08)3.hkust: 中文电话数据集(LDC2005S15, LDC2005T32)4原创 2017-12-31 22:57:58 · 48448 阅读 · 11 评论 -
Kaldi学习笔记(四)——thchs30中文在线识别
在前面的笔记中,我们已经训练出thchs30模型。这篇文章主要介绍如何用训练好的模型识别我们自己的语音。一、安装portaudio首先我们cd到tools下面,执行:./install_portaudio.sh然后在cd到src下面,执行:make ext二、创建相关文件从voxforge把online_demo拷贝到thchs30下,和s5同级,online_demo原创 2018-01-02 11:12:19 · 13095 阅读 · 14 评论 -
Kaldi学习笔记(一)——Kaldi的下载安装与编译
Kaldi是一款基于C++编写的开源语音识别工具箱。这款工具既可以在Windows下编译也可以在Linux下编译。本次我是在虚拟机装上了Ubuntu。文档里面也说还是建议在Linux下使用Kaldi。一、下载下载直接利用git版本控制系统就可以了,打开终端,直接在你的实验目录下输入命令:git clone https://github.com/kaldi-asr/kaldi.g原创 2017-12-25 21:08:01 · 22739 阅读 · 6 评论 -
Kaldi学习笔记(二)——实例yesno和timit的应用
Kaldi的安装与编译请参考:Kaldi的安装与编译Kaldi的例子有很多,在egs目录下面,对Kaldi不熟悉的小白们可以先从yesno和timit两个例子入手,这样可以对Kaldi有个直观的认识。一、运行yesno实例该实例是一个非常小的数据集,每一条记录都是一系列yes或者no的语音,标注是由文件名来标注的。先运行一下。切换到./egs/yesno/s5目录下,运行sudo.原创 2017-12-27 17:37:59 · 8927 阅读 · 5 评论 -
Kaldi学习笔记(五)——使用CVTE训练好的SR模型做中文在线识别
关于Kaldi的下载与编译请参考:http://blog.csdn.net/snowdroptulip/article/details/78896915CVTE公司开源其训练好的TDNN模型,我们可以使用该模型来进行在线识别。一、下载首先从http://kaldi-asr.org/models.html下载模型;二、解压把下载好的模型原创 2018-01-02 15:39:22 · 13664 阅读 · 2 评论