Magichub重口音对话ASR挑战赛圆满结束

最新推荐文章于 2024-09-28 13:33:29 发布

Magic Data

最新推荐文章于 2024-09-28 13:33:29 发布

阅读量138

点赞数

文章标签：语音识别人工智能科技机器学习

本文链接：https://blog.csdn.net/weixin_47718443/article/details/125405433

版权

6月16日落幕的Magichub重口音对话ASR挑战赛，由MagicData等多方主办，汇集众多企业及高校。赛事旨在提升语音识别对复杂口音的理解，通过高质量数据推动技术进步。挑战赛结果揭晓，未来将继续探索重口音AI数据解决方案和先进算法

摘要由CSDN通过智能技术生成

6月16日，“Magichub重口音对话ASR挑战赛”圆满结束。6月20日，主办方公布挑战赛结果。

本次挑战赛由 Magic Data (北京爱数智慧科技有限公司) 、中国科学院声学研究所、西北工业大学、上海交通大学、北京邮电大学主办，Magichub 开源社区、上海白玉兰开源开放研究院、OpenVINO中文社区、SegmentFault思否开发者社区、稀土掘金技术社区、示说网协办。

从5月中旬开启报名以来，吸引了来自中国移动、小米科技、搜狗、同花顺、四川长虹、中邮消费金融、网易游戏、网易有道、58同城、平安科技、招商银行、中国联通、京东方、苏州驰声、小鹏汽车等企业，以及中国科学院大学、西北工业大学、西安交通大学、天津大学、上海师范大学、北京理工大学、北京林业大学、中国科技大学等高校组队报名参赛。

挑战赛背景

随着人工智能领域的飞速发展，越来越多的AI产品走进大众生活，语音已经是目前市场上的人工智能产品的主要入口之一，语音识别也是当前人工智能领域的重点研究方向。从智能汽车的语音导航，到微信聊天的语音转写，人们乐于使用语音互动所带来的便捷体验。但是，在中国这个人口众多、地域辽阔的市场，人们对同一个词的发音差异就有着天壤之别，如何让机器更好的学习和理解人类复杂多变的口音，成为不少Machine Learning研究者和从业者面临的巨大挑战。而数据的匹配度和丰富性是推动语音识别系统性能提升的最重要因素之一，通过高质量的结构化数据进行训练提升识别率，才能让机器领会说话人意图和指令，以作出更加精准的响应。本次挑战赛希望与企业、机构及高校携手，共同探索重口音对话AI领域的创新发展。

挑战赛设计

为了帮助参赛者快速、高质量完成模型开发和训练，主办方提供了基线系统，提供给参赛者使用。我们采用传统的Hybrid的建模方式，基于Kaldi开源工具搭建了简易的重口音对话ASR 赛道的基线系统。首先用chain模型对Magic Data提供的160小时中文对话数据训练了一个CNN+TDNN-F的基础模型，然后使用14小时的重口音普通话对话数据集进行了声学模型的自适应。

评分判定方式

参赛者提交模型和推理结果，限制48小时之内识别结果反馈。主办方承诺模型不对外公布，仅用于判定选手是否有违规行为。标点符号、非语言符不参与最终 WER（此处WER即指CER，字错误率）计算。

竞赛结果与排名

经过激烈角逐，本次Magichub重口音对话ASR挑战赛获奖队伍如下，恭喜获奖团队。