人们对自己声音的好奇、认知和应用在当今智能家居的催化下,显现出空前高涨的渴望和需求。而现实状况是,在语音算法方面在近讲和远讲还有很多问题需要解决,特别是远讲的场景。众所周知,大多数公开可用的数据库是文本无关的单通道近讲数据。
近日昆山杜克大学与AISHELL共同推出了一个基于远场文本相关的说话人认证数据库﹣HI-MIA发布在语音数据开源平台openslr上(http://www.openslr.org/85/)。并发表在论文“HI-MIA : A FAR-FIELD TEXT-DEPENDENT SPEAKER VERIFICATION DATABASE AND THE BASELINES”中,介绍了HI-MIA数据库,还提出了一套端到端的神经网络基线系统,而研究表明这套系统在远讲注册远讲测试任务中EER可以达到3.29%,在近讲注册远讲测试任务中EER可以达到4.02%。
HI-MIA数据库
HI-MIA,是一个智能家居场景下的固有唤醒词数据库。该数据库共包含340个说话人,每个说话人语料包含了近场麦克风拾