保姆级Linux系统Ubuntu20.04下开源语音识别工具kaldi配置
前言
Kaldi是当前最流行的开源的语音识别工具包,旨在提供灵活且可扩展的组件,包括多种语音信号处理,语音识别,声纹识别和深度神经网络。Kaldi的代码主要用C++编写,在此之上使用bash 和python脚本做了一些工具。目前,主要由语音大佬 Daniel Povey 带领的团队在github上进行开发和维护。
好消息是:2019年10月,Daniel博士正式加入小米公司,担任小米集团语音首席科学家,主要工作就是带领团队开发新一代Kaldi。下面是大佬的弟子,以及大佬来华之后的一些新闻视频,大家可以了解一下。
Kaldi团队日常都会做些什么?在Dan下做事或着和Dan合作做事,都是个怎样的体验?
Kaldi之父:新一代子项目布局基本完成,打造语音识别框架基石
语音识别大神Daniel Povey在小米开发新一代Kaldi
话不多说,开干!
一. kaldi准备–虚拟机准备
第一步打开虚拟机(我的Ubuntu是搭载在虚拟机上的,关于Windows下如何搭建虚拟机环境安装Ubuntu