CSLU: Portland Cellular Telephone Speech Version 1.3数据集介绍,官网编号LDC2008S01

CSLU: Portland Cellular Telephone Speech Version 1.3是一个针对手机通话环境中语音识别的数据集。以下是这个数据集的一些详细信息:

  • 数据来源:该数据集包含从手机通话中捕获的语音数据,这些数据来自真实的手机通话环境,因此包含了各种背景噪音和通话条件。
  • 文件格式:数据以数字方式捕获,并保存为8 kHz 16位线性编码,这种格式可以确保音频质量。
  • 目录结构:数据集包含多个目录,如“docs”目录包含各种文档文件,而“speech”、“txt”和“phn”目录则包含音频、文本和音素标注文件。这些文件根据其呼叫号码mod10被细分为目录,例如,文件PC131FAS.wav、PC131FAS.txt和PC131FAS.phn都可以在/portcell/speech/13、/portcell/txt/13以及/portcell/phn/13这些路径下找到。
  • 标注信息:每个音频文件都与其对应的文本转录和音素标注相对应。这些标注信息提供了音频与文本之间的映射关系,对于训练语音识别模型至关重要。例如,文件名PC131FAS.wav表示这句话来自呼叫者131,包含对某个问题的回答,而相应的文本转录和音素标注则可以在PC131FAS.txt和PC131FAS.phn这两个文件中找到。

 获取方法:

方法1:注册LDC账号并加入组织获取数据,官网链接:LDC官网

方法2:关注公众号,回复CSLU: Portland Cellular Telephone Speech Version 1.3LDC语料小助手icon-default.png?t=N7T8https://mp.weixin.qq.com/s/8GgZFh9XAr7FYwivQ_ajRg

 

  • 4
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值