声明:工作以来主要从事TTS工作,平时看些文章做些笔记。文章中难免存在错误的地方,还望大家海涵。平时搜集一些资料,方便查阅学习:TTS 论文列表 http://yqli.tech/page/tts_paper.html TTS 开源数据 http://yqli.tech/page/data.html。如转载,请标明出处。欢迎关注微信公众号:低调奋进
本文整理一下GAN在语音合成声学模型上的研究,统计可能不全。GAN在语音合成中的应用更多是在声码器部分,而在声学模型部分的研究很少。使用GAN的目的更多解决过平滑问题,从而使韵律更好,情感表达更丰富。本文搜集近几年的文章,做简短的总结:
基于tacotron
1) TFGAN: A Lightweight Library for Generative Adversarial Networks (2017)
https://ai.googleblog.com/2017/12/tfgan-lightweight-library-for.html
2) A new gan-based end-to-end tts training algorithm (2019)
https://arxiv.org/pdf/1904.04775.pdf
3) A New End-to-End Long-Time Speech Synthesis System Based on Tacotron2 (2019)
https://sci-hub.se/https://doi.org/10.1145/336490