直播预告 | AAAI 2022论文解读：基于生成模型的语音/歌声合成与歌声美化-CSDN博客

「AI Drive」是由 PaperWeekly 和 biendata 共同发起的学术直播间，旨在帮助更多的青年学者宣传其最新科研成果。我们一直认为，单向地输出知识并不是一个最好的方式，而有效地反馈和交流可能会让知识的传播更加有意义，从而产生更大的价值。

本期 AI Drive，我们邀请到浙江大学计算机科学与技术学院硕士生刘静林，为大家在线解读其发表在 AAAI 2022 的最新研究成果：DiffSinger: Singing Voice Synthesis via Shallow Diffusion Mechanism。对本期主题感兴趣的小伙伴，3 月 1 日（本周二）晚 7 点，我们准时相约 PaperWeekly 直播间。

直播信息

在对声音频谱的建模中，非周期性的参数影响着清音、呼吸声以及浊音的自然度。但这种参数具有不确定性，简单的损失函数很难进行较好的建模。最近两年，生成式模型在声音合成领域崭露头角，本次报告将围绕生成式模型在声音合成中的应用这一话题，介绍该领域的前沿研究。同时，本次报告还会重点介绍近日热度骤增的歌声合成任务，从现代歌声合成的流水线，到现阶段歌声合成中的难点与瓶颈。最后，本次报告会介绍一类新兴任务：歌声美化。

论文标题：

DiffSinger: Singing Voice Synthesis via Shallow Diffusion Mechanism

论文链接：

https://arxiv.org/abs/2105.02446

代码链接：

https://github.com/MoonInTheRiver/DiffSinger

本次分享的具体内容有：

生成式模型建模声音频谱的前沿研究
歌声合成任务
歌声美化任务

嘉宾介绍

刘静林 / 浙江大学硕士生

刘静林，浙江大学计算机科学与技术学院二年级研究生。2020 年于浙江大学竺可桢学院混合班（计算机科学与技术专业）本科毕业，保至本校攻读硕士研究生。研究方向为自然语言处理，包含：语音&歌声合成、机器翻译、唇语识别&合成，专注于深度生成模型在自然语言处理中的应用。在 AAAI、ACL、NeurIPS 等国际人工智能顶级会议上发表论文 10 余篇。相关开源仓库收到学术界与工业界的广泛关注。

直播地址 & 交流群

本次直播将在 PaperWeekly 视频号和 B 站直播间进行，扫描下方海报二维码或点击阅读原文即可免费观看。线上分享结束后，嘉宾还将在直播交流群内实时 QA，在 PaperWeekly 微信公众号后台回复「AI Drive」，即可获取入群通道。

视频号直播间：

扫描下方二维码关注 PaperWeekly 视频号，第一时间获取开播提醒。