LOCUST - Longitudinal Corpus and Toolset for Speaker Verification
摘要
在本文中,我们提出了一个新的纵向语料库和工具集,以努力解决语音老化对说话人验证的影响。
我们已经检查过以前对年龄相关语音变化的纵向研究以及它对现实世界用例的适用性。我们的研究结果表明,科学家们将与年龄相关的语音变化视为一种障碍,而不是利用身份验证者的优势。此外,我们发现与音频录音的参与者的时间跨度和参与者数量相关的公共可用语料库的显着缺乏。与民用IT安全系统中使用的扬声器验证系统相比,我们还发现了适用于政府监控系统的说话人识别技术发展的重大偏见。
为了解决上述问题,我们建立了一个开放式项目,拥有最大的公共纵向演讲者数据库,其中包括229位发言者,平均通话时间超过15小时,平均每位发言人21年。我们组装,清理和标准化录音,并开发了用于语音特征提取的软件工具,我们将其释放到公共领域。
索引术语:纵向语料库,说话者验证。
1.简介
最近,说话者验证系统越来越