0. 说明
具体有三个PPG-TTS的版本:
- 港中文的论文模型细节
- 我实现的细节(sch, lh, zhaoxt)
- 阿里达摩院2020InterSpeech的结构细节
目的是:
- 达到论文的Demo的水平,
- 获取PPG的经验
1. ASR-PPG-Extractor
1.0. HMM模型部分
关于ForceAlignment那部分, 不懂. 出发点是ForceAlignment的结果和DNN部分
以下简称ASR-DNN部分为ASR
1.1. 标准的港中文ASR
1.1.1. 英文ASR模型结构
1.1.2. 中文ASR模型结构
1.1.3. 港中文ASR的训练结果
1.2. 我(实验室)的ASR
1.2.1. 中/英问ASR模型结构
详细超参数:
1.2.2. 我(实验室)的ASR的训练结果
过程博客: