icassp 2021 语音合成文章总结

最新推荐文章于 2024-08-19 22:47:44 发布

我叫永强

最新推荐文章于 2024-08-19 22:47:44 发布

阅读量2.9k

点赞数

分类专栏：语音合成综述文章标签：语音识别人工智能深度学习机器学习自然语言处理

本文链接：https://blog.csdn.net/liyongqiang2420/article/details/118073124

版权

语音合成综述专栏收录该内容

44 篇文章 46 订阅

订阅专栏

文章转载请标明出处：微信公众号低调奋进

icassp2021 会议在2021 六月6~11日举行，一共录取1757篇（语音领域的会议录取文章真的多，记得搞体系结构和数据领域相关的会议录取也就几十篇或者百篇，可以很容易的看个大概。个人毕业后就没发过文章，究其原因，比较渣~~），具体的文章列表参见https://2021.ieeeicassp.org/Papers/AcceptedPapers.asp。记得每年会议结束后都有好心人做文章总结，今年竟然没有等到，我就先梳理一下文章发表大概情况，对具体的文章方案类型归类等日后我有时间再介绍（这个月搬家杂事和学习新方向知识，时间不太充裕）。我使用关键字搜索统计出语音合成相关文章共有63篇（统计不全勿怪），接下来，先看一下每个方向的情况。根据以下表格和饼状图可知，语音合成方向热点主要是研究声学模型、声音转换、情感合成以及声码器。其中声学模型的研究倾向于合成速度提升设计、增加语言信息优化表现性能、prosody建模和优化等等。声音转换还是any-to-any、any-to-many和may-to-many方面的研究，感觉做one-shot更热点。（周末先统计一下大概情况，其实很多文章以前都浏览过，具体的方案归纳等全部浏览完给出总结），具体的文章参见文章统计列表。

语音合成文章情况表（单位：篇）

		篇数
前端	多音字，韵律，g2p等等。	3
声学模型	语言特征转声学特征，attention工作以及双重学习	19
声码器	波形生成	6
个性化	少数据，脏数据应用等	3
多语言	多语言模型	2
歌唱合成	歌唱和音乐合成和转换	4
情感	风格和情感	6
多模态	talking head等等	2
声音转换	基于GAN方案和特征解耦方案	14
其它	基于EEG合成，数据，MOS评测以及语音合成的应用	5