语音合成领域统计列表请访问http://yqli.tech/page/tts_paper.html,语音识别领域论文统计请访问http://yqli.tech/page/asr_paper.html。开源语音数据查询 http://yqli.tech/page/data.html。如何查找语音资料请参考文章https://mp.weixin.qq.com/s/eJcpsfs3OuhrccJ7_BvKOg)。读者有什么建议可以直接给我发消息,我将不断修改该统计。如有转载,请注明出处。欢迎关注微信公众号:低调奋进。
ICASSP 2022有1906篇文章,ICASSP 2021有1757篇文章,文章数量较多,本文的统计不保证完全正确,读者可参考性阅读。
ICASSP 2022 文章链接
https://docs.google.com/spreadsheets/d/1YgWCNhQTWlmx7HGq3W74OuPGVN-ThTRC92TIiyoNd8U/edit?usp=sharing
ICASSP 2021 文章链接
https://docs.google.com/spreadsheets/d/1hUV7dUoI4HMkhrcsU8O4rPUscrXfy8AXHHQ9GP0CfjU/edit?usp=sharing
一 语音合成篇
以下表一给出具体分类说明。图一为icassp 2021和2022文章总数,2021有63篇文章,2022有89篇文章。表二和图二为icassp 2021和2022语音合成每个研究方向的文章分布状况以及对比,由此可知声学模型、声音转换、情感合成系统、声码器和歌唱等占据绝对的优势。
表一 语音合成分类说明
分类 |
说明 |
前端 |
多音字,韵律,g2p等等。 |
声学模型 |
语言特征转声学特征,attention工作,多说话人以及双重学习 |
声码器 |
波形生成 |
个性化 |