活动报名｜音频AIGC开源平台，音频生成开源工具包Amphion的歌声转换指南

智源社区

于 2024-01-10 16:06:03 发布

阅读量175

点赞数

文章标签：音视频 AIGC

原文链接：https://mp.weixin.qq.com/s?__biz=MzU5ODg0MTAwMw==&mid=2247542556&idx=2&sn=8c1a8f05942a9b00a9e28df6cb657560&chksm=ffc01565ef481084a351ff99d0ef8a4a43a2787b66e20aa0f250784155dd566b1b34b9d6d76f&scene=126&sessionid=0

版权

报告介绍了Amphion，一个集成语音、歌声转换和音乐生成的开源平台。报告详细讲解了歌声转换任务、技术架构、开发逻辑，以及如何使用Amphion进行音频研究。主讲人张雪遥是该项目的联合发起人，拥有丰富的研究背景和学术成果。

摘要由CSDN通过智能技术生成

报告主题：音频生成开源工具包Amphion的歌声转换指南

报告日期：01月16日 14:30-15:30

主题简介：

Amphion是一个集成了语音合成转换、歌声合成转换、音效音乐生成等多功能为一体的音频AIGC开源平台（https://github.com/open-mmlab/Amphion）。在本次报告中，我们将针对于歌声转换（Singing Voice Conversion），介绍该任务的定义、研究发展脉络、最前沿的技术框架范式，以及Amphion对该任务的集成思路与架构设计。

除此之外，我们还将介绍Amphion的整体系统架构、代码开发逻辑，以及各类文档的设计思路。最后，我们将通过实例说明，如何基于Amphion来进行各项音频生成任务的研究与开发。

Amphion现已开源并提供免费商用，其不仅具备语音及歌声合成转换、音效及音乐生成等多种能力，更可实现转换过程可视化，有效地降低了应用门槛，助力更广泛的开发者进行AI音频研发。

报告嘉宾：

张雪遥，香港中文大学（深圳）2022级博士生，导师为武执政教授。音频生成开源工具包Amphion的联合发起人。他的研究兴趣为人工智能音乐、歌声生成等。曾入选2023年腾讯犀牛鸟精英人才计划，曾在MM、WWW、ACL、ICASSP等顶级学术会议上发表论文7篇，谷歌学术引用数百次，参与维护多项学术开源项目。本硕毕业于武汉大学、中国科学院大学，曾获国家奖学金、校园十佳歌手等荣誉。

个人主页：https://www.zhangxueyao.com/

项目链接：https://github.com/open-mmlab/Amphion

论文链接：https://arxiv.org/abs/2312.09911

扫描下方二维码

或点击「阅读原文」报名

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。