interspeech2022的文章列表:
https://www.isca-speech.org/archive/interspeech_2022/index.html
其中tts和vc的tutorials的ppt可参见:
tts:https://tts-tutorial.github.io/interspeech2022/INTERSPEECH_Tutorial_TTS.pdf
vc:https://tts-tutorial.github.io/interspeech2022/INTERSPEECH_Tutorial_VC.pdf
语音识别和语音合成论文统计表
https://docs.google.com/spreadsheets/d/1Bz52a3vMjLGvitx4M6OKp4w6YjVfjSAl-pvYS_aHrzY/edit?usp=sharing
(文章较多,统计难免存在错误,故本文仅供参考!仅供参考!)
一 语音合成篇
以下表一给出具体分类说明。图一为interspeech 2022文章总数,共有178篇。表一和图二为语音合成每个研究方向的文章分布状况以及对比,由此可知声学模型、声音转换、情感合成系统、声码器、个性化和歌唱等占据绝对的优势。另外mos统计所有音频质量评估的文章,因为有相关的比赛,所以文章较多。
表一 语音合成分类说明
分类 |
说明 |
frontend |
多音字,韵律,g2p等等。 |
acoustic |
语言特征转声学特征,attention工作,多说话人以及双重学习 |
vocoder |
波形生成 |
adaptation | 个性化,少数据,脏数据应用等自适应 |
multilingual |
多语言模型 |