1. 问题
提取数据的xvector特征时报错:
Preparing data_test ......
cj_script/data_test_prep.sh: data preparation succeeded
utils/fix_data_dir.sh: file data_test/spk2utt is not in sorted order or not unique, sorting it
- data_test/utt2spk differ: char 1, line 1
utt2spk is not in sorted order when sorted first on speaker-id
(fix this by making speaker-ids prefixes of utt-ids)
2. 注意点
3. 解决
3.1 解决之前
3.2 解决之后
其实就是将MP替换为G0000的形式。
然后完美解决,不再报错。
反思:将不同的数据集混合在一起的时候,需要注意数据的格式、命名等!