Kaldi是开源语音识别工具平台。这款工具既可以在Windows下编译也可以在Linux下编译。目前研究生的研究方向是深度学习的语音识别,所以开始进行一些初步的工作。由于家里的台式机和实验室的电脑都是普通PC机,而自己的笔记本又是mac pro。所以准备同时在两种主机上搭建环境,不过参考说还是在Linux下做开发多一些,我就顺便把Linux装在mac的虚拟机上,就安了个虚拟机装上了Ubuntu14.04。文档里面也说还是建议在Linux下使用Kaldi。没怎么用过Linux了,用了一天的时间搭建Kaldi最后完成了并跑了一下测试例子。下面把过程记录和遇到问题记录一下。
1. 下载 Ubuntu 14.04 版本
建议用这个版本,16的版本会带来一些问题,之后查到的资料和解决方法少。
。
2. 在 Windows 10 系统下面创建空白磁盘分区:
- 右键我的电脑
- 选择管理
- 选择磁盘管理
- 选择一个磁盘
- 右键压缩卷
- 压缩后的磁盘变成为未分配部分(80G)
3. 下载并安装好软碟通(UltraISO)
- 打开软件
- 点击打开
- 找到 Ubuntu 系统所在目录,找到 iso 文件并打开
- 点击启动,选择写入硬盘镜像
- 大概检查下各个选项(基本是默认格式)
- 点击格式化
- 点击写入
- 刻录完成
4. 从 USB 启动选择空闲空间安装 Ubuntu 即可(可以使用easyBCD进行系统启动切换)
之后还遇到装好了系统后分辨率非常不兼容的问题,由于我用的是34寸带鱼屏,用命令行修改分辨率无法解决,去N卡官网下载了linux对应的驱动.run格式,之后安装(安装方法自行读娘,提醒下要在无图形界面的模式下输入安装的命令行Ctrl+Alt+F1,否则报错)
安装 CUDA 以及 Kaldi 之前的基本配置
输入:
sudo apt-get update
sudo apt-get install libtool
sudo apt-get install autoconfsudo apt-get install wget
sudo apt-get install perl