thchs30的语料下载地址:
http://www.openslr.org/18/
语料库的准备
首先,下载好语料压缩包后,我们将压缩包放到kaldi的esg/s5/thchs30中
在chchs30中创建一个文件夹叫做thchs30-openslr,然后通过指令来解压三个语料库:
具体操作步骤如下:
1.在官网上下载thchs30语料库(http://www.openslr.org/18/)
2.下载的三个语料库将其放到kaldi中esg/s5/thchs30中
我们注意,在这里的解压最好是在kaldi上用解压指令完成,
解压.gz文件:*.gz 用 gzip -d或者gunzip 解压
解压tar文件指令:tar -xvf file