声明:工作以来主要从事TTS工作,平时看些文章做些笔记。文章中难免存在错误的地方,还望大家海涵。平时搜集一些资料,方便查阅学习:TTS 论文列表 http://yqli.tech/page/tts_paper.html TTS 开源数据 http://yqli.tech/page/data.html。如转载,请标明出处。欢迎关注微信公众号:低调奋进
我感觉一个领域的成熟标志就是综述文章的出现,从4月份到现在已经有三篇高质量的综述文章发出,本文主要向读者推荐该三篇文章。虽然我已经阅读了这三篇文章,但我不想直接翻译出来。读者想学习更多的知识,需要自己通读一遍。(综述的文章都很简单,阅读综述文章其实是一种享受).
1Review of end-to-end speech synthesis technology based on deep learning
西安交通大学在4月份更新的文章
2 A Survey on Neural Speech Synthesis
亚洲微软在6月份更新的文章
3 A Survey on Audio Synthesis and Audio-Visual Multimodal Processing
中国电子科技大学在8月份更新的文章
Review of end-to-end speech synthesis technology based on deep learning
该篇文章主要介绍基于神经网络的语音合成技术,也就是近五年来的发展状况。该篇文章的重点在声学模型和声码器的介绍已经优缺点,当然也简单总结了可用的数据集。