CSR-III Text数据集介绍,官网编号LDC95T6

ARPA(高级研究计划局,现在称为DARPA,即国防高级研究计划局)连续语音识别(CSR)基准测试是一系列旨在评估连续语音识别技术进步的评价。这些基准测试提供了标准化的数据集和评估指标,以便比较不同的研究方法。

以下是ARPA CSR评估的简要概述:

  1. ARPA CSR-I(1971-1976):这是第一个系列的评估,重点是孤立词的识别。
  2. ARPA CSR-II(1976-1983):这个系列转向连续语音识别,重点是句子识别。它引入了华尔街日报(WSJ)数据集,该数据集成为了语音识别研究的一个标准基准。
  3. ARPA CSR-III(1988-1993):这个系列继续评估连续语音识别,专注于更大的词汇量和更复杂的任务。它引入了新的数据集,如Switchboard对话电话语音语料库。

 获取方法:

方法1:注册LDC账号并加入组织获取数据,官网链接:LDC官网

方法2:关注公众号,回复CSR-III TextLDC语料小助手icon-default.png?t=N7T8https://mp.weixin.qq.com/s/8GgZFh9XAr7FYwivQ_ajRg

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值