kaldi新手入门及语音识别的流程(标贝科技)
欢迎体验标贝语音开放平台
地址:https://ai.data-baker.com/#/?source=qaz123
(注:填写邀请码hi25d7,每日免费调用量还可以翻倍)
一、kaldi
-
kaldi简介
Kaldi是当前最流行的开源的语音识别工具包,旨在提供灵活且可扩展的组件,包括多种语音信号处理,语音识别,声纹识别和深度神经网络。Kaldi的代码主要用C++编写,在此之上使用bash 和python脚本做了一些工具。 -
kaldi安装和编译
kaldi由它的开发团队在github进行维护,以下介绍安装目前最新的kaldi的步骤。
(1)配置gcc版本
当前版本的kaldi需要本地服务器编译器gcc版本为5.4.0及以上。可以通过 gcc -v 命令查看编译器版本。
(2)获取当前版本kaldi
可以通过拷贝,或者直接从github下载两种方式获取,这里介绍后者。
使用 git clone https://github.com/kaldi-asr/kaldi.git 命令下载kaldi到本地服务器。
然后介绍kaldi的编译方式。进入kaldi文件夹,按照INSTALL中的说明进行编译。在INSTALL中,如下图,有两种编译kaldi的方式,这里介绍第一种。
按照文件提示,先到tools/目录下面按照INSTALL中的说明编译,完成之后到src/目录下按照INSTALL中的说明编译即可。
首先,进入tools/目录编译,按照INSTALL的提示,按顺序执行命令,在执行extras/check_dependencies.sh 命令时,可能会出现以下提示,这里可以不用理会,直接进行下一步。