Kaldi
Kaldi
是一个强大的语音识别工具库(ASR
),主要由Daniel Povey
开发和维护。目前支持GMM-HMM、SGMM-HMM、DNN-HMM
等多种语音识别的模型的训练和预测。其中DNN-HMM
中的神经网络还可以由配置文件自定义,DNN、CNN、TDNN、LSTM
以及Bidirectional-LSTM
等神经网络结构均可支持。
下载Kaldi
1、可参考kaldi官网:http://kaldi-asr.org/doc/install.html
Kaldi
代码放在Github
中,我们可以通过git clone直接克隆代码,然后CD
到项目中:
然后再cd kaldi
安装Kaldi
1、安装说明位于kaldi
下的INSTALL
文件中,不过只适用于Linux(Mac,Ubuntu,Centeos,Debian)
等,对于Windows
下安装Kaldi
的方法,有单独的说明windows/INSTALL
。linux
进入tools/
和src/
根据INSTALL
中的方法进行安装。
2、进入tools目录下运行,检查Kaldi
环境依赖
cd tools/
extras/check_dependencies.sh
根据check_dependencies.sh输出结果的提示,安装缺的包,否则后期可能出现异常,安装后重新执行一遍上面的代码查看是否环境安装成功。
3、编译安装
如果你有多个CPU
并希望加速安装,通过提供-j
选项来构建指定CPU
数量,例如使用4个CPU
make -j 4
4、然后再进入src目录下,进行安装
./configure --shared
make depend -j 8
make -j 8
-j 8表示
同时运行编译安装,因为make
需要很长时间,但是8
个并发对于没有太多核的笔记本或者小型电脑可能比较多,根据自己的情况选择参数。
理论上,应该安装完成。
遇到的问题
- 友情提示,如果是用虚拟机安装的话,尽可能给较大的硬盘空间,我给了50G,实际可能用了30G左右。
- 如果在配置过程中,下载网速太慢,可以参考配置共享文件夹
- 如果在配置过程中,虚拟机硬盘空间不够,可以参考virtual box虚拟机硬盘扩充
- 如果报错The GPG keys listed for the "***" repository are already installed but they are not corret
则可以 yum install intel-mkl-64bit-2019.2-057 --nogpgcheck
- 如果之后还是报错,根目录文件系统空间不足,可以参考扩展虚拟机根目录
- 如果遇到报错internal compiler error,如下图
可以采取下图的做法