在中国幅员辽阔的多口音地域,机器如何更好的学习和理解人类复杂多变的方言?智能客服、智能家居等在内的对话式AI系统,如何能更好的提供服务?这些都是人工智能落地真实场景所面临的挑战。希望通过本次挑战赛与企业、机构及高校共同探索重口音对话AI领域的创新发展。
本次挑战赛由 Magic Data (北京爱数智慧科技有限公司) 、中国科学院声学研究所、西北工业大学、上海交通大学、北京邮电大学主办,Magichub 开源社区、上海白玉兰开源开放研究院、OpenVINO中文社区、SegmentFault思否开发者社区、稀土掘金技术社区、示说网协办。已有四十多组来自各大高校和企业的参赛队伍参赛。
2022年6月14日,正式向参赛队伍开放测试集。结果和模型的提交时间截止至6月16日中午12点。结果将于6月20日公布。
测试集
主办方针对赛道“重口音对话场景下的语音识别(ASR)准确率”开放测试集:
测试数据与Magic Data提供14小时的重口音普通话对话数据同源,数据的发布请关注官方渠道,本次任务测试集会提供对应的时间标注信息,测试集中不存在噪音符号。
测试集下载链接,将以邮件形式发送至参赛队伍的报名邮箱。
更多详情: