0. 说明
使用sch给的ForceAlignment好的aishell1语料, 训练ASR, 用来提取PPG
- alignment是有0.9和1.1增强的, 去掉就好
alignment文件在: 链接:https://pan.baidu.com/s/1pWWH1mUFWsdi9xgbDVa3xQ 提取码:4h5a
Git: https://github.com/ruclion/ppgs_extractor_10ms_sch_lh_aishell1
Lab路径: /datapool/home/hujk17/ppgs_extractor_10ms_sch_lh_aishell1
0.1. Alignment文件的制作
目前不会TODO...先贴出来大家讨论的供参考~(感谢):
- 方案1: kaldi按步骤(我猜是ForceAlignment的结果, 猜的哈, 具体的去kaldi中应该很简单~)
- 方案2: 可以类似MFA 一样,提取每个音素的时长,再把每一帧对应到到音素(每一个音素作为一个类别)
1. 数据处理
wav_16000|
|- train |
|- S0727 |
|- BAC009S0730W0126.wav
|- test |...
|- dev |...
1.1. 提取MFCC
文件: p