下载好自己的数据集后,按照这样的方式构造路径。(这是我自己的路径,具体的需要看local/make_voxceleb1_v2.pl中的路径传入)
datadir=datadir=/home/zw/D-TDNN/data/voxceleb1
datadir不是数据集存放的路径,有些脚本中生成的文件会放在这个路径下。
voxceleb1_root=/home/zw/kaldi-trunk2/egs/voxceleb/v1/Voxceleb1
voxceleb1_root就存放数据集的路径。
然后执行run.sh
报错
进入Log中查看
报这个错的原因有多种,一种就是你在cmd.sh中的run.sh和你运行的run.sh不一致,比如说你用了run.sh1 runcopy.sh这种就不行,名字必须一样。
然后那个no segments file exits不是报错,这是个提示。
还有一种可能是路径问题,找不到脚本文件。
更改make_mfcc和path.sh中的路径后都无效。
估计是kaldi安装过程中有什么路径或者是包未添加,建议遇到这个问题后重装。
重装kaldi
git clone git://github.com/kaldi-asr/kaldi.git kaldi
进入tools后,执行extras/check_dependencies.sh
报错waring python2.7 is not default python
因为我把默认的python换成3.8了,但是这里必须用2.7,否则后续的OpenFst包将无法编译。
rm -rf /usr/bin/python
删除python3.8的软链接
重新建立
ln -s /usr/python/bin/python2.7 /usr/bin/python
其他内容可参照添加链接描述