在kaldi工具包使用小数字语料库创建一个简单的ASR系统(番外篇)

本文介绍了如何借助Kaldi工具包,利用自录的小数字语料库创建一个仅识别0到9数字的孤立词语音识别系统。系统虽小,但涵盖了ASR系统的基本组件。在实践中,特别强调了SRILM语言模型工具包的安装,它是成功搭建ASR系统的关键步骤。
摘要由CSDN通过智能技术生成
相信很多人已经看过kaldi英文官网上关于该系统的搭建流程。虽然官方已经写的很通俗易懂,但是第一次接触的话还是不可避免的会碰到许多坑。恰巧最近实践了一下,把整个实践过程写了下来。一是方便自己后续回顾本次实验,避免以后碰到类似问题还得重复造轮子,做无用功。二是希望将官网的搭建指引写的更通俗易懂些,降低新手学习的门槛。

官方搭建指南传送门:Kaldi for Dummies tutorial

本系统的搭建意义:使用自己录制的语料库搭建一个简单的ASR系统,整个系统一共包含0到9共十个英文数字,系统搭建完成后可进行简单的孤立词识别(仅限数字0到9)。系统虽小,但五脏俱全,是入门理解如何利用kaldi搭建语音系统的好例子。


因为官方教程已经说的很详细了,所以这里只讲一些作为新手去实践这个tutorial时需要额外注意的地方。

一,预前准备:
  • SRILM的安装:SRILM是一个语言模型工具包,没有它你就无法生成自己的语言模型,也就无法搭建自己的ASR系统(因为语言模型,声学模型,词典是传统的ASR系统的必要组成部分,缺一不可)这个安装很重要,很多新手容易败在这一关。而官方搭建指南里只用了如下一段话概述安装流程,并且放在了快要工程定稿的部分:
    SRILM installation
    
    You also need to install language modelling toolkit that is used in my example - SRI Language Modeling Toolkit (SRILM).
    
    Task
    
    For detailed installation instructions go to kaldi-trunk/tools/install_srilm.sh (read all comments inside).
如果你是选择用./install_srilm.sh文件来执行srilm的相关安装操作,你的终端最终会反馈给你这些信息:
Installation of SRILM fini
  • 2
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 13
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 13
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值