CHiME2 Grid数据集是来源于CHiME(China Multimodal Interaction)挑战的语音片段,特别针对语音识别任务而设计。CHiME挑战是一套自动语音识别评估系统,主要用于日常环境中的远程多麦克风语音识别。
具体来说,CHiME2 Grid数据集包含了多种类型的音频数据,旨在模拟现实生活中的各种语音识别场景。这些数据包括小词汇ASR任务和静态扬声器在家庭环境中双耳录制的音频,移动扬声器和中等词汇ASR任务在家庭环境中双耳录制的音频,以及在许多室内和室外城市环境中使用1、2和6通道平板设备录制的音频。此外,该数据集还包含了在家庭环境中进行远程麦克风多方对话的音频数据。
这些多样化的音频数据使得CHiME2 Grid数据集成为研究远程多麦克风语音识别技术的重要资源。通过使用这个数据集,研究人员可以测试和改进他们的语音识别算法,以更好地适应各种实际场景中的语音输入。
获取方法:
方法1:注册LDC账号并加入组织获取数据,官网链接:LDC官网
方法2:关注公众号,回复CHiME2 GridLDC语料小助手https://mp.weixin.qq.com/s/8GgZFh9XAr7FYwivQ_ajRg