报告主题:音频生成开源工具包Amphion的歌声转换指南
报告日期:01月16日 14:30-15:30
主题简介:
Amphion是一个集成了语音合成转换、歌声合成转换、音效音乐生成等多功能为一体的音频AIGC开源平台(https://github.com/open-mmlab/Amphion)。在本次报告中,我们将针对于歌声转换(Singing Voice Conversion),介绍该任务的定义、研究发展脉络、最前沿的技术框架范式,以及Amphion对该任务的集成思路与架构设计。
除此之外,我们还将介绍Amphion的整体系统架构、代码开发逻辑,以及各类文档的设计思路。最后,我们将通过实例说明,如何基于Amphion来进行各项音频生成任务的研究与开发。
Amphion现已开源并提供免费商用,其不仅具备语音及歌声合成转换、音效及音乐生成等多种能力,更可实现转换过程可视化,有效地降低了应用门槛,助力更广泛的开发者进行AI音频研发。
报告嘉宾:
张雪遥,香港中文大学(深圳)2022级博士生,导师为武执政教授。音频生成开源工具包Amphion的联合发起人。他的研究兴趣为人工智能音乐、歌声生成等。曾入选2023年腾讯犀牛鸟精英人才计划,曾在MM、WWW、ACL、ICASSP等顶级学术会议上发表论文7篇,谷歌学术引用数百次,参与维护多项学术开源项目。本硕毕业于武汉大学、中国科学院大学,曾获国家奖学金、校园十佳歌手等荣誉。
个人主页:https://www.zhangxueyao.com/
项目链接:https://github.com/open-mmlab/Amphion
论文链接:https://arxiv.org/abs/2312.09911
扫描下方二维码
或点击「阅读原文」报名