0. 说明
ForcePPG: 一种基于ForceAlignment的PPG
- 使用Aishell-1+Librispeech ForceAlignment结果训练的ASR, 训练的并不充分, 为了和之前的结果能够对比, 不进行ckpt early stop的替换
- ASR未用到F0, 使用的结构参看:[1] https://blog.csdn.net/u013625492/article/details/109670529 [2] https://blog.csdn.net/u013625492/article/details/109206085 [3] https://blog.csdn.net/u013625492/article/details/109201157
- 效果可能不是最好, 但是作为PPG可以用
1. 提取流程
1.1. Wav
- DataBaker
- LJSpeech
简单的RAW的WAV就可以了