Kaldi安装+编译+egs/yesno脚本运行

本文详细介绍了Kaldi的下载、安装、编译过程以及运行简单语音识别脚本yesno的步骤。首先,通过git克隆源码,然后在Linux环境下检查并安装依赖库。接下来,编译Kaldi源码,包括configure、makedepend和make。最后,运行egs/yesno脚本,验证Kaldi的语音识别功能。通过这个Hello World示例,读者可以快速上手Kaldi的基本操作。
摘要由CSDN通过智能技术生成


kaldi,我就不做过多介绍了,源码在github上,官方教程网址是 http://kaldi-asr.org/doc/index.html

源码下载

我的操作系统是Linux。
下载直接利用git版本控制系统就可以了,打开终端,直接在你的实验目录下的命令行输入命令:

git clone https://github.com/kaldi-asr/kaldi.git

稍等一会,提示OK后,能够看到以下文件:
在这里插入图片描述

  • egs :此目录为 Kaldi 例子目录,其中例子包含了不乏语音识别、语种识别、声纹识别、关键字识别等。
  • misc : 此目录包含了一些 pdf、以及相关 docker、htk 等资源
  • scripts: 此目录只用来存放 Rnnlm,以及相应的运行脚本。
  • src : 此目录为 Kaldi 的源代码目录,Kaldi 的多数算法的源代码都存放于此,其中不乏GMM、Ivector、Nnet等一系列的算法。
  • tools: 此目录主要存放 Kaldi 依赖库的安装脚本
  • windows: 此目录为在 Windows 平台运行所必须的脚本以及相关的执行程序。

安装依赖及工具

在kaldi文件夹下可以检查依赖库是否已经安装。
运行指令:tools/extras/check_dependencies.sh,会提示没有安装的包,根据脚本输出的提示安装对应包即可。

如果全部安装完成,会显示如下:
在这里插入图片描述

关于第三方工具,这里主要介绍必须安装的两个工具:OpenFst及CUB,具体作用就不介绍了。对应命令是在tools文件夹下,命令行依次运行指令

make openfst
make cub

第三方包还有很多,其它基本类似。等待安装成功即可。

编译kaldi代码

这是必要步骤,不要漏这一步。
编译环境kaldi使用configure命令来配置,在src目录下配置即可。
配置完成后分别运行:

make depend
make

大约要几十分钟吧。可以用-j 4作为make的参数,使用多线程加速编译。
编译完成后就可以运行其中的egs目录下的例子了。

egs/yesno脚本运行

yesno脚本是一个最简单的语音识别脚本,只能识别Yes和No(当然还有沉默)。进入对应文件夹,命令行使用./run.sh。如果前面步骤没有出错,很快就会有最后结果。
运行结果如下:
在这里插入图片描述

最后一行输出表示,232个测试样例全部判断准确。
最后的识别结果输出在exp/mono0a/decode_test_yesn,打开文件看看即可。
在这里插入图片描述

以上就是本次分享的Kaldi的helloworld步骤了。

结束语

跑通一个简单的样例后,就是对源码的阅读、探索、整理了。
希望本文能对Kaldi的新手有帮助。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

邵政道

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值