历年NIST Speaker Recognition Evaluation (NIST SRE) 是由美国国家标准与技术研究院(NIST)定期组织的一系列声纹识别技术评测活动。这些评测旨在评估声纹识别技术的最新进展,并推动该领域的研究和应用。以下是NIST SRE的一些重要年份和对应的评测特点:
- NIST SRE 1996:
- 首次举办的NIST SRE,为后续的评测奠定了基础。
- 主要评估了电话语音中的声纹识别技术。
- NIST SRE 1998:
- 增加了对文本无关的声纹识别技术的评估。
- 引入了新的数据集和评测指标。
- NIST SRE 2000:
- 引入了基于高斯混合模型(GMM)的声纹识别技术。
- 评测了不同语言(如英语、西班牙语)的声纹识别性能。
- NIST SRE 2002:
- 评估了短语音样本的声纹识别技术。
- 引入了对音频信道变化(如噪声、失真)的鲁棒性评估。
- NIST SRE 2004:
- 增加了对多通道(如电话、麦克风)语音的声纹识别评估。
- 评估了说话人确认和说话人辨认两种任务的性能。
- NIST SRE 2006:
- 引入了基于联合因子分析(JFA)的声纹识别方法。
- 评测了更大规模的声纹数据库。
- NIST SRE 2008:
- 评估了基于i-vector的声纹识别技术。
- 增加了对长语音样本的评估。
- NIST SRE 2010:
- 引入了基于深度学习的声纹识别技术。
- 评测了跨信道和跨语言的声纹识别性能。
- NIST SRE 2012:
- 重点关注了复杂背景噪声下的声纹识别技术。
- 增加了对移动端设备语音的评估。
- NIST SRE 2016:
- 评估了基于深度学习的端到端声纹识别系统。
- 引入了新的评测指标,如等错误率(EER)和最小检测代价函数(minDCF)。
- NIST SRE 2018 及之后:
- 评测了更先进的声纹识别技术,包括基于神经网络的方法。
- 增加了对音频和视频融合(Audio-Visual)的声纹识别评估。
- 评估了在实际应用场景中声纹识别系统的性能,如远场语音识别和移动设备语音识别。
随着技术的不断发展,NIST SRE的评测范围和内容也在不断扩大和更新,以适应声纹识别领域的最新趋势和挑战。这些评测不仅为研究人员提供了一个展示自己技术实力的平台,也为声纹识别技术的商业化应用提供了重要的参考依据。
历年NIST SRE数据集获取方法:
方法1:注册LDC账号并加入组织获取数据,官网链接:LDC官网
方法2:关注公众号,回复NIST SRELDC语料小助手https://mp.weixin.qq.com/s/8GgZFh9XAr7FYwivQ_ajRg