报名 | 全球首个小资源音色克隆赛结果出炉，高分队伍线上报告会

转载于 2021-03-05 11:30:00 发布 · 316 阅读

CC 4.0 BY-SA版权

原文链接：http://challenge.ai.iqiyi.com/detail?raceId=5fb2688224954e0b48431fe0

文章标签：

近年来，迁移学习、风格迁移，说话人编码和因素解耦等方面的最新进展，为低资源语音克隆的提供了潜在的解决方案。2020年，爱奇艺联合多家单位在ICASSP2021举办多说话人多风格音色克隆大赛-M2VoC，M2VoC挑战赛旨在提供一个通用的数据集以及一个公平的测试平台，对语音克隆任务进行研究。作为2021年声学、语音和信号处理国际会议（ICASSP2021）信号处理挑战旗舰任务之一，非常鼓励学术界和工业界的研究人员加入《多说话人多风格音色克隆大赛（M2VoC）》挑战。

大赛上线以来，全球共有153支队伍报名参赛。竞赛组委会进行了两轮严格主观评测：第一轮包括所有提交队伍的系统，第二轮包括第一轮得分高的几个队伍的系统（从第二名开始得分差别不大的几个组）。

最终获胜者是结合两轮测试的结果进行选取。对于track1，最终分数是在音质、风格和说话人相似度上的MOS得分平均值；对于track2，最终分数是在音质和说话人相似度上的MOS得分平均值。注意：本次竞赛最终结果没有计入可懂度测试分数。

近日，根据已提交的方案，竞赛组委会审核并公布了ICASSP2021 M2VoC高分队伍排名。

具体排名可点击“阅读原文”前往官网查看。

3月10日下午2点，我们邀请了本次四个赛道的高分排名top2队伍代表，与组委会成员和评审老师们一起齐聚“云”上，共同分享优秀参赛方案、并回顾本次大赛的精彩内容。

报告会具体信息

时间：

3月10日，下午2点-5点

议程：

时间	嘉宾	主题
2:00-2:20	李海, 爱奇艺高级经理	开幕辞
2:20-2:40	谢磊, 西北工业大学教授	拟人化语音合成技术新进展
2:40-3:00	吴志勇, 清华大学副教授	面向智能语音交互的可控重音语音生成
3:00-3:20	田霄海, 新加坡国立大学研究员	Non-parallel Data Voice Conversion
3:20-3:50	杨明祺，猿辅导AI Lab研究员	THE YUANFUDAO TTS SYSTEM FOR M2VOC 2021
3:50-4:20	汪涛，中科院自动化所博士生	个性化语音合成风格迁移
4:20-4:50	李鸿斌，VIVO深圳研究院研究员	ICASSP2021 M2VoC竞赛模型分享
4:50-5:20	簡仲明，国立台湾大学Speech Processing Lab研究员	Investigating on Incorporating Pretrained and Learnable Speaker Representation for Multi-Speaker Multi-Style Text-to-Speech

参与方式：

扫码????进入分享群，获取详细直播链接！

群满可添加爱奇艺小助手微信：iqiyixiaozhushou

备注“报告会”，拉你进群

评审及分享嘉宾介绍

谢磊：
西北工业大学教授、博导，音频语音与语言处理实验室（ASLP@NPU）负责人，中国计算机学会语音对话与听觉专委会常务委员，中国中文信息学会语音信息专委会副主任，语音顶级期刊ACM/IEEE Trans. ASLP编委，发表论文180余篇。
吴志勇：
清华大学深圳国际研究生院副研究员，博士生导师。清华大学-香港中文大学媒体科学、技术与系统联合研究中心副主任。研究兴趣为面向人工智能的智能言语交互技术。承担国家自然科学基金、香港特区政府研资局等多项课题。获2009及2016年度教育部科学技术进步奖。指导的学生多人次获得优秀学位论文、国家奖学金、优秀毕业生，在2017全球极客大赛“AI仿声验声攻防赛”中斩获桂冠。

田霄海：
Xiaohai Tian received his Ph.D. from Nanyang Technological University, Singapore. He received the B.Sc and M.Sc degrees from Northwestern Polytechnical University, Shaanxi, China in 2006 and 2011 respectively. He is now a research fellow at the Human Language Technology (HLT) Lab, School of Electrical and Computer Engineering, National University of Singapore. His research interests include voice conversion, speech synthesis, singing synthesis and anti-spoofing.

组织单位