Kaldi 底层是使用C++ 编写的语音识别工具,旨在供语音识别研究员使用。
也是语音识别领域最常用的一个工具。
它自带了很多特征提取模块、语音模型代码,可直接使用或重新训练GMM-HMM 等模型。
还支持GPU进行训练,功能非常强大。很多新手在使用Kaldi时候,都遇到很多问题
网上资料一大堆,有的比较老,很现在的安装编译方法不一样,会各种报错。
所以把自己安装编译kaldi 过程中,遇到的问题以及安装方法分享给大家。
在安装过程中,请尽量使用物理机Ubuntu 来进行安装。虚拟机Ubuntu 会出现不能安装的问题。
如何安装:我们直接切入正题:
1、首先,通过我的另外一篇博客,将Ubuntu 的源换成国内的阿里源。
地址:https://blog.csdn.net/u012798683/article/details/100765882
2、按照步骤更换完源后,安装git
sudo apt-get install git
3、从GitHub上下载kaldi 的源码
git clone https://github.com/kaldi-asr/kaldi.git
4、安装kaldi 依赖工具以及所使用的第三方工具库
sudo apt-get install git
sudo apt-get install bc
sudo apt-get install g++
sudo apt-get install zlib1g-dev make automake autoconf bzip2 libtool subversion
sudo apt-get install libatlas3-base
5、按照上面的安装完kaldi 的依赖包之后,我们解压kaldi,运行自带的脚本文件,来检测是否安装完成所需要的依赖。
cd kaldi-master
cd tools
运行依赖检测脚本:
./extras/check_dependencies.sh
会提示缺失MKL依赖包,也会提示你,到tools目录下,运行install_mkl.sh脚本文件进行MKL安装。
运行安装脚本:
./extras/chech_dependencies.sh
安装完成以后,再次运行检查脚本:
./extras/check_dependencies.sh
会提示缺少另外一个依赖包,sox,也同样会告诉你安装方式,运行安装命令即可。
安装完成后,再次检测,运行脚本文件。值到没有提示错误,且返回下图所示内容,依赖既安装完成。
在tools目录下面输入命令:
make -j 4 (意思是多线程加快进度)
或者直接输入make 也可。然后耐心等待
tools目录下make 完成后,说明我们的外部依赖和第三方库已经全部安装完成。
下面进入到src目录下,进行编译安装。
cd ..
cd src
进入src 按照指令进行安装:
./configure --shared
make depend
make
执行完上述命令,接下来就是耐心等待make的完成
这里进行make 的时候花的时间比较久,耐心等待即可,
make 完成后,会提示如下图
提示echo Done
Done
即表示make完成,
下面我们可以跑一个简单的例子,来验证,kaldi是否安装成功。
我们进入到路径,kaldi-master/egs/yesno/s5,目录下
运行下面的命令:
./run.sh
运行完成后,如果没有报错,那说明你已经安装成功。
运行完 yesno 例子以后,显示如下,说明已经安装成功。
kaldi 就算安装完成。