1、Aurora语料库
跟tidigits有点类似,说话的内容也是1-9ZO,test有1000条数据,train有8000多条数据。在Kaldi中没有Aurora的样例,可以在tidigits的样例上加以修改。
2、修改tidigits样例
首先语料库的路径是要修改的。然后根据你自己的语料库的目录结构来修改这里的判断条件和赋值。
两个语料库最主要的区别是,aurora中每条wav的文件名中包含了说话人名字,但是在tidigits中wav的上层目录名称是说话人名字。所以获取说话人信息的方式有些不同,主要修改下面几个地方: