在近期举行的Interspeech 2021会议上,主办方开展了“非母语儿童语音识别”的特别会议,并发布专项数据集用于算法评测竞赛,旨在推动非母语儿童语音识别技术的研究。此次竞赛共分为4个细分赛道,网易有道ASR团队斩获其中2项冠军与1项亚军。
Interspeech是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的顶级旗舰国际会议,作为全球最大的综合性语音信号处理领域的科技盛会,历届Interspeech会议都备受全球各地语音语言领域人士的广泛关注
当前,自动语音识别(ASR)技术已经在很多场景中得到实际应用,但当应用于特定类型的人群(例如非母语人群和儿童等)的语音数据时,效果仍有较大的可提升空间。
非母语语音中,几种现象会大大降低传统ASR的性能,包括发音错误的单词、不合语法的发音等;儿童语音则由于生理差异(例如较短的声道长度)、认知差异(例如语言习得)和行为差异(例如习惯性低语)等因素,使得其更具挑战。目前也缺乏针对非母语和儿童语音的公开数据库。
虽然面临诸多挑战,但在实际应用中,很多语音数据均来自于非母语人士和儿童,例如语言学习等常见场景。研究针对这两类人群的ASR技术,具有非常大的意义和价值。
网易有道 ASR 团队凭借自身的AI技术能力,结合在