2021年04月_我叫永强

原创 2021年语音合成论文统计（1~4月）

论文统计每月更新一次，主要跟踪语音合成的发展状况(很多文章都是在会议后才发出，但不影响统计。统计过程难免存在疏漏，因此统计结果仅供参考，所有文章统计列表请访问http://yqli.tech/page/tts_paper.html）。读者有什么建议可以直接给我发消息，我将不断修改该统计。如有转载，请注明出处。欢迎关注微信公众号：低调奋进。首先，先看一下每月的文章数量，总体来说数量呈上升趋势，4月份的文章数量还是挺多。接下来，看一下每个方向的情况。由下面表格的具体数据和柱状图可知，语音合成前

2021-04-30 10:21:31 230

原创语音合成论文优选：Parallel Tacotron 2: A Non-Autoregressive Neural TTS Model with Differentiable Duration Mod

声明：语音合成论文优选系列主要分享论文，分享论文不做直接翻译，所写的内容主要是我对论文内容的概括和个人看法。如有转载，请标注来源。欢迎关注微信公众号：低调奋进Parallel Tacotron 2: A Non-Autoregressive Neural TTS Model with Differentiable Duration Modeling本文是google在2021.04.13更新的文章，主要解决Parallel Tacotron的对齐问题，本系统不需要额外的对齐信息，具体的文章链接

2021-04-26 14:14:10 721 1

原创语音合成论文优选：Parallel Tacotron: Non-Autoregressive and Controllable TTS

声明：语音合成论文优选系列主要分享论文，分享论文不做直接翻译，所写的内容主要是我对论文内容的概括和个人看法。如有转载，请标注来源。欢迎关注微信公众号：低调奋进Parallel Tacotron: Non-Autoregressive and Controllable TTS本文是google在2020.10.22发表的文章，主要是tactron并行化，从而提高速度，具体的文章链接https://arxiv.org/pdf/2010.11439.pdf（想写Parallel Tacotro

2021-04-26 10:20:57 698

原创语音合成论文优选：AdaSpeech 2: Adaptive Text to Speech with Untranscribed Data

声明：语音合成论文优选系列主要分享论文，分享论文不做直接翻译，所写的内容主要是我对论文内容的概括和个人看法。如有转载，请标注来源。欢迎关注微信公众号：低调奋进AdaSpeech 2: AdaptiveTexttoSpeechwith Untranscribed Data本文是清华大学和亚洲微软在2021.04.20更新的文章，主要的工作是只使用音频而不存在对应标注文件的语料进行个性化定制，具体文章链接https://arxiv.org/pdf/2104.09715.pdf本文需要...

2021-04-21 14:33:28 523

原创创业团队：太极图形团队

注：非广告！今天刷知乎发现的"太极图形团队"，真心佩服，所以分享出来，读者也可以抓住这个机会~以前导员说过这样一句话，感觉还是挺有道理：“人才主要分为三类，为人类的进步而努力者，为国家繁荣而奋斗者，为生活家庭而奔波者”。而"太极图形团队"属于站在金字塔尖的天之骄子团队，这是一辆发往未来新的列车，相关读者可以抓住机遇。以下是该团队简单介绍“太极图形 (Taichi Graphics) 团队（北京）主导开发开源基础设施太极 (Taichi) 编程语言 (github.com/taichi-dev/

2021-04-20 21:42:26 1614

原创语音识别论文：Comparing the Benefit of Synthetic Training Data for Various Automatic Speech Recognition Arc

声明：我主要从事语音合成，对语音识别的学习主要出于兴趣。文章内容摘如有错误，还望读者指出，共同学习进步。欢迎关注微信公众号：低调奋进Comparing the Benefit of Synthetic Training Data for Various Automatic Speech Recognition Architectures本文2021.04.12号由德国亚琛工业大学计算机科学系发布，主要对比使用TTS合成的数据对不同ASR架构的影响，具体的文章链接https://arxiv.

2021-04-19 16:37:41 325

原创语音合成论文优选：Dependency Parsing based Semantic Representation Learning with Graph Neural Network for Enh

声明：语音合成论文优选系列主要分享论文，分享论文不做直接翻译，所写的内容主要是我对论文内容的概括和个人看法。如有转载，请标注来源。欢迎关注微信公众号：低调奋进Dependency Parsing based Semantic Representation Learning with Graph Neural Network for Enhancing Expressiveness of Text-to-Speech本文是清华和香港中文大学联合研究中心在2021.04.14更新的文章，主要使

2021-04-15 18:03:48 239

原创语音合成论文优选：Towards Multi-Scale Style Control for Expressive Speech Synthesis

声明：语音合成论文优选系列主要分享论文，分享论文不做直接翻译，所写的内容主要是我对论文内容的概括和个人看法。如有转载，请标注来源。欢迎关注微信公众号：低调奋进以后文章阅读不对论文的好坏和缺点进行点评，感觉有点得罪人。以后文章主要讲解论文的主要内容即可。Towards Multi-Scale Style Control for Expressive Speech Synthesis本文是清华大学在2021.04.08更新的文章，主要提出使用全局特性GST和局部特性LPE来控制情感语音合成，具体

2021-04-13 17:02:06 417

原创语音合成论文优选：Flavored Tacotron: Conditional Learning for Prosodic-linguistic Features

声明：语音合成论文优选系列主要分享论文，分享论文不做直接翻译，所写的内容主要是我对论文内容的概括和个人看法。如有转载，请标注来源。欢迎关注微信公众号：低调奋进Flavored Tacotron: Conditional Learning for Prosodic-linguistic Features本文是AI Foundation, USA在2021.04.08更新的文章，主要添加韵律特征，使合成的语音更加自然，具体的文章链接https://arxiv.org/pdf/2104.04.

2021-04-12 18:49:45 267

原创语音合成论文优:开源数据Hi-Fi Multi-Speaker English TTS Dataset

声明：语音合成论文优选系列主要分享论文，分享论文不做直接翻译，所写的内容主要是我对论文内容的概括和个人看法。如有转载，请标注来源。欢迎关注微信公众号：低调奋进Hi-Fi Multi-Speaker English TTS Dataset本文是NVIDIA在2021.04.03更新的文章，主要为促进tts的multi-speaker的研究，对LibriVox进行处理，获取11speakers的300小时的训练语料，具体文章链接https://arxiv.org/pdf/2104.01497.p

2021-04-07 20:42:59 624

原创语音合成论文优选： Multi-rate attention architecture for fast streamable Text-to-speech spectrum modeling

声明：语音合成论文优选系列主要分享论文，分享论文不做直接翻译，所写的内容主要是我对论文内容的概括和个人看法。如有转载，请标注来源。欢迎关注微信公众号：低调奋进Multi-rate attention architecture for fast streamableText-to-speechspectrum modeling本文是facebook在20210.04.01更新的文章，主要提出multi-rateattention减少latency，使其无论句子长短都保持RTF稳定，具体的文章...

2021-04-07 19:32:18 283 1

原创语音合成论文优选：M2voc大赛总结The M2voc Challenge 2021

声明：语音合成论文优选系列主要分享论文，分享论文不做直接翻译，所写的内容主要是我对论文内容的概括和个人看法。如有转载，请标注来源。欢迎关注微信公众号：低调奋进TheMulti-speaker Multi-style Voice CloningChallenge2021本文是西北工业大学、新加坡国立大学，清华大学，爱奇艺等7家学术界和工业界在2021.04.05发表的文章，主要对Multi-speaker Multi-style Voice CloningChallenge2021大赛采...

2021-04-06 12:10:52 500

低调奋进