语音合成Text-to-Speech 端到端的TTS解决方案,从文本到语音 两个步骤 特征预测Tacotron2 将音符/音素 转换为中间表示(梅尔频谱)声码器WaveGlow 将中间表示(梅尔频谱)转换为人能听到的声波 声码器 WaveGlow采用对抗生成网络(GAN),变分自编码器(VAE)以及基于流的方法(Flow-Based)