文章转载请标明出处:微信公众号 低调奋进
icassp2021 会议在2021 六月6~11日举行,一共录取1757篇(语音领域的会议录取文章真的多,记得搞体系结构和数据领域相关的会议录取也就几十篇或者百篇,可以很容易的看个大概。个人毕业后就没发过文章,究其原因,比较渣~~),具体的文章列表参见https://2021.ieeeicassp.org/Papers/AcceptedPapers.asp。记得每年会议结束后都有好心人做文章总结,今年竟然没有等到,我就先梳理一下文章发表大概情况,对具体的文章方案类型归类等日后我有时间再介绍(这个月搬家杂事和学习新方向知识,时间不太充裕)。我使用关键字搜索统计出语音合成相关文章共有63篇(统计不全勿怪),接下来,先看一下每个方向的情况。根据以下表格和饼状图可知,语音合成方向热点主要是研究声学模型、声音转换、情感合成以及声码器。其中声学模型的研究倾向于合成速度提升设计、增加语言信息优化表现性能、prosody建模和优化等等。声音转换还是any-to-any、any-to-many和may-to-many方面的研究,感觉做one-shot更热点。(周末先统计一下大概情况,其实很多文章以前都浏览过,具体的方案归纳等全部浏览完给出总结),具体的文章参见文章统计列表。
语音合成文章情况表(单位:篇)
篇数 | ||
前端 | 多音字,韵律,g2p等等。 | 3 |
声学模型 | 语言特征转声学特征,attention工作以及双重学习 | 19 |
声码器 | 波形生成 | 6 |
个性化 | 少数据,脏数据应用等 | 3 |
多语言 | 多语言模型 | 2 |
歌唱合成 | 歌唱和音乐合成和转换 | 4 |
情感 | 风格和情感 | 6 |
多模态 | talking head等等 | 2 |
声音转换 | 基于GAN方案和特征解耦方案 | 14 |
其它 | 基于EEG合成,数据,MOS评测以及语音合成的应用 | 5 |
我们看一下饼状图
详细文章列表