Magichub重口音对话ASR挑战赛圆满结束

6月16日落幕的Magichub重口音对话ASR挑战赛,由MagicData等多方主办,汇集众多企业及高校。赛事旨在提升语音识别对复杂口音的理解,通过高质量数据推动技术进步。挑战赛结果揭晓,未来将继续探索重口音AI数据解决方案和先进算法
摘要由CSDN通过智能技术生成

6月16日,“Magichub重口音对话ASR挑战赛”圆满结束。6月20日,主办方公布挑战赛结果。

本次挑战赛由 Magic Data (北京爱数智慧科技有限公司) 、中国科学院声学研究所、西北工业大学、上海交通大学、北京邮电大学主办,Magichub 开源社区、上海白玉兰开源开放研究院、OpenVINO中文社区、SegmentFault思否开发者社区、稀土掘金技术社区、示说网协办。

从5月中旬开启报名以来,吸引了来自中国移动、小米科技、搜狗、同花顺、四川长虹、中邮消费金融、网易游戏、网易有道、58同城、平安科技、招商银行、中国联通、京东方、苏州驰声、小鹏汽车等企业,以及中国科学院大学、西北工业大学、西安交通大学、天津大学、上海师范大学、北京理工大学、北京林业大学、中国科技大学等高校组队报名参赛。

挑战赛背景

随着人工智能领域的飞速发展,越来越多的AI产品走进大众生活,语音已经是目前市场上的人工智能产品的主要入口之一,语音识别也是当前人工智能领域的重点研究方向。从智能汽车的语音导航,到微信聊天的语音转写,人们乐于使用语音互动所带来的便捷体验。但是,在中国这个人口众多、地域辽阔的市场,人们对同一个词的发音差异就有着天壤之别,如何让机器更好的学习和理解人类复杂多变的口音,成为不少Machine Learning研究者和从业者面临的巨大挑战。而数据的匹配度和丰富性是推动语音识别系统性能提升的最重要因素之一,通过高质量的结构化数据进行训练提升识别率,才能让机器领会说话人意图和指令,以作出更加精准的响应。本次挑战赛希望与企业、机构及高校携手,共同探索重口音对话AI领域的创新发展。

挑战赛设计

为了帮助参赛者快速、高质量完成模型开发和训练,主办方提供了基线系统,提供给参赛者使用。我们采用传统的Hybrid的建模方式,基于Kaldi开源工具搭建了简易的重口音对话ASR 赛道的基线系统。首先用chain模型对Magic Data提供的160小时中文对话数据训练了一个CNN+TDNN-F的基础模型,然后使用14小时的重口音普通话对话数据集进行了声学模型的自适应。

评分判定方式

参赛者提交模型和推理结果,限制48小时之内识别结果反馈。主办方承诺模型不对外公布,仅用于判定选手是否有违规行为。标点符号、非语言符不参与最终 WER(此处WER即指CER,字错误率)计算。

竞赛结果与排名

经过激烈角逐,本次Magichub重口音对话ASR挑战赛获奖队伍如下,恭喜获奖团队。

致谢

感谢来自中科院声学所、西北工业大学、上海交通大学和北京邮电大学在语音领域深耕多年,有着丰富研究和实战经验的专家,作为竞赛组委会成员,全程给予答疑支持和指导。

感谢上海白玉兰开源开放研究院、OpenVINO中文社区、SegmentFault思否开发者社区、稀土掘金技术社区、示说网协办等多家开源社区支持。

今后,Magic Data 将持续探索重口音领域的高质量 AI 数据解决方案,同时也期待学术和工业界在该问题的先进算法和技术,与业界和学界携手共建更优的重口音对话识别解决方案。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值