活动报名|音频AIGC开源平台,音频生成开源工具包Amphion的歌声转换指南

报告介绍了Amphion,一个集成语音、歌声转换和音乐生成的开源平台。报告详细讲解了歌声转换任务、技术架构、开发逻辑,以及如何使用Amphion进行音频研究。主讲人张雪遥是该项目的联合发起人,拥有丰富的研究背景和学术成果。
摘要由CSDN通过智能技术生成

da13f76f0db313b630f00a107b759fa6.png

报告主题:音频生成开源工具包Amphion的歌声转换指南

报告日期:01月16日 14:30-15:30

e9973370e24c83307c39cd0ddcaed792.png

主题简介:

Amphion是一个集成了语音合成转换、歌声合成转换、音效音乐生成等多功能为一体的音频AIGC开源平台(https://github.com/open-mmlab/Amphion)。在本次报告中,我们将针对于歌声转换(Singing Voice Conversion),介绍该任务的定义、研究发展脉络、最前沿的技术框架范式,以及Amphion对该任务的集成思路与架构设计。

除此之外,我们还将介绍Amphion的整体系统架构、代码开发逻辑,以及各类文档的设计思路。最后,我们将通过实例说明,如何基于Amphion来进行各项音频生成任务的研究与开发。

Amphion现已开源并提供免费商用,其不仅具备语音及歌声合成转换、音效及音乐生成等多种能力,更可实现转换过程可视化,有效地降低了应用门槛,助力更广泛的开发者进行AI音频研发。

报告嘉宾:

张雪遥,香港中文大学(深圳)2022级博士生,导师为武执政教授。音频生成开源工具包Amphion的联合发起人。他的研究兴趣为人工智能音乐、歌声生成等。曾入选2023年腾讯犀牛鸟精英人才计划,曾在MM、WWW、ACL、ICASSP等顶级学术会议上发表论文7篇,谷歌学术引用数百次,参与维护多项学术开源项目。本硕毕业于武汉大学、中国科学院大学,曾获国家奖学金、校园十佳歌手等荣誉。

个人主页:https://www.zhangxueyao.com/

项目链接:https://github.com/open-mmlab/Amphion

论文链接:https://arxiv.org/abs/2312.09911

扫描下方二维码

7fec3149b48a1083b6d60efffaf3c340.png

或点击「阅读原文」报名

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值