kaldi关于数据预处理
基本数据
四个预处理文件
wav.scp 每条语音的 ID 及其存储路径
wav_id(音频id) | wav_path(文件路径) |
---|---|
sen_1 | /home/kaldi/data/sen_1.wav |
sen_2 | /home/kaldi/data/sen_2.wav |
text 每条语音的 ID 及其对应文本
wav_id(音频id) | text(文本) |
---|---|
sen_1 | 中国共产党成立100周年 |
utt2spk 每条语音的 ID 及其说话人 ID | |
wav_id(音频id) | 说话人id |
– | – |
sen_1 | speak_1 |
spk2utt 每个说话人的 ID 及其所说语音的所有 ID
使用 utils/spk2utt_to_utt2spk.pl 或 utils/utt2spk_to_spk2utt.pl 可实现 spk2utt 和 utt2spk 的相关转换
说话人id | wav_id(音频id) |
---|---|
speak_1 | <