1996 English Broadcast News Transcripts (HUB4) 数据集介绍,官网编号LDC97T22

HUB4是 DARPA (Defense Advanced Research Projects Agency) 发起的一个语音识别项目的一部分,旨在推进语音识别技术的发展。具体来说,HUB4 是该项目中使用的一个子集,包含了从 1996 年的广播新闻中收集的大量语音数据。这些数据通常用于训练和评估自动语音识别(ASR)系统。

HUB4 数据集通常包括语音录音的转录(即文字版),这些转录是手动生成的,以匹配录音中的语音内容。这些转录对于训练 ASR 系统至关重要,因为它们提供了语音到文本的对应关系。

 获取方法:

方法1:注册LDC账号并加入组织获取数据,官网链接:LDC官网

方法2:关注公众号,回复HUB4LDC语料小助手icon-default.png?t=N7T8https://mp.weixin.qq.com/s/8GgZFh9XAr7FYwivQ_ajRg

  • 9
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值