直播预告 | AAAI 2022论文解读:基于生成模型的语音/歌声合成与歌声美化

e8ce07d7ac79f2a123742dadae8b3ef2.gif

59bae15f53bae63c55781016c3063791.png

94030932040c8549d9a82f5997bd619e.png

「AI Drive」是由 PaperWeekly 和 biendata 共同发起的学术直播间,旨在帮助更多的青年学者宣传其最新科研成果。我们一直认为,单向地输出知识并不是一个最好的方式,而有效地反馈和交流可能会让知识的传播更加有意义,从而产生更大的价值。

本期 AI Drive,我们邀请到浙江大学计算机科学与技术学院硕士生刘静林,为大家在线解读其发表在 AAAI 2022 的最新研究成果:DiffSinger: Singing Voice Synthesis via Shallow Diffusion Mechanism。对本期主题感兴趣的小伙伴,3 月 1 日(本周二)晚 7 点,我们准时相约 PaperWeekly 直播间。

直播信息

在对声音频谱的建模中,非周期性的参数影响着清音、呼吸声以及浊音的自然度。但这种参数具有不确定性,简单的损失函数很难进行较好的建模。最近两年,生成式模型在声音合成领域崭露头角,本次报告将围绕生成式模型在声音合成中的应用这一话题,介绍该领域的前沿研究。同时,本次报告还会重点介绍近日热度骤增的歌声合成任务,从现代歌声合成的流水线,到现阶段歌声合成中的难点与瓶颈。最后,本次报告会介绍一类新兴任务:歌声美化。

论文标题:

DiffSinger: Singing Voice Synthesis via Shallow Diffusion Mechanism

论文链接:

https://arxiv.org/abs/2105.02446

代码链接:

https://github.com/MoonInTheRiver/DiffSinger

本次分享的具体内容有: 

  • 生成式模型建模声音频谱的前沿研究

  • 歌声合成任务

  • 歌声美化任务

嘉宾介绍

ac36f8247e1933ddd70ba938b7dbdc5b.png

 刘静林 / 浙江大学硕士生 

刘静林,浙江大学计算机科学与技术学院二年级研究生。2020 年于浙江大学竺可桢学院混合班(计算机科学与技术专业)本科毕业,保至本校攻读硕士研究生。研究方向为自然语言处理,包含:语音&歌声合成、机器翻译、唇语识别&合成,专注于深度生成模型在自然语言处理中的应用。在 AAAI、ACL、NeurIPS 等国际人工智能顶级会议上发表论文 10 余篇。相关开源仓库收到学术界与工业界的广泛关注。

直播地址 & 交流群

本次直播将在 PaperWeekly 视频号和 B 站直播间进行,扫描下方海报二维码点击阅读原文即可免费观看。线上分享结束后,嘉宾还将在直播交流群内实时 QA,在 PaperWeekly 微信公众号后台回复「AI Drive」,即可获取入群通道

视频号直播间:

扫描下方二维码关注 PaperWeekly 视频号,第一时间获取开播提醒。

9028a6e94654260b1c098193170db0b7.png

B 站直播间:

https://live.bilibili.com/14884511

9eb230cdf2a4af23893417508e0a5758.png

合作伙伴

e1c382cb5725459fc92a363cdf4812ab.png

f0608c83690b67f22f889ff563344a9f.png

🔍

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

·

e18a1f5563683985fa5b168d342ea2fd.png

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值