出错:
原因一
在使用fix_data_dir.sh或者validate_data_dir.sh检查数据准备文件夹中的utt2spk时报错,这是由于准备utt2spk文件的uttid前缀不是spkid。
如:
8866_2_spk1_20 8866_spk1
解决办法
将内容改为:
8866_spk1_2_20 8866_spk1
即可
原因二
第二个原因比较难发现(我找了一个下午,最后还是向师姐求助才得以解决,知道导致这个问题还有这个原因)但这个原因导致的问题出现概率不会太大,一般排除其他原因再考虑这个
kaldi中建议utt2spk存储格式为:
spkid-id spkid
如
8866-20 8866
即uttid的spkid前缀与wavid连接符是“-”,而我们有时储存utt2spk这个文件时格式为 :
8866_20 8866
这样可能会导致出错。(不会是100%的概率,目前还未发现这是什么原因造成的,知道的小伙伴欢迎留言告诉我哦)