CSLU: Portland Cellular Telephone Speech Version 1.3数据集介绍，官网编号LDC2008S01

最新推荐文章于 2024-08-24 10:02:25 发布

ldcdata

最新推荐文章于 2024-08-24 10:02:25 发布

阅读量238

点赞数 4

文章标签：自然语言处理 python 深度学习人工智能

本文链接：https://blog.csdn.net/ldcdata/article/details/139105282

版权

CSLU: Portland Cellular Telephone Speech Version 1.3是一个针对手机通话环境中语音识别的数据集。以下是这个数据集的一些详细信息：

数据来源：该数据集包含从手机通话中捕获的语音数据，这些数据来自真实的手机通话环境，因此包含了各种背景噪音和通话条件。
文件格式：数据以数字方式捕获，并保存为8 kHz 16位线性编码，这种格式可以确保音频质量。
目录结构：数据集包含多个目录，如“docs”目录包含各种文档文件，而“speech”、“txt”和“phn”目录则包含音频、文本和音素标注文件。这些文件根据其呼叫号码mod10被细分为目录，例如，文件PC131FAS.wav、PC131FAS.txt和PC131FAS.phn都可以在/portcell/speech/13、/portcell/txt/13以及/portcell/phn/13这些路径下找到。
标注信息：每个音频文件都与其对应的文本转录和音素标注相对应。这些标注信息提供了音频与文本之间的映射关系，对于训练语音识别模型至关重要。例如，文件名PC131FAS.wav表示这句话来自呼叫者131，包含对某个问题的回答，而相应的文本转录和音素标注则可以在PC131FAS.txt和PC131FAS.phn这两个文件中找到。

获取方法：

方法1：注册LDC账号并加入组织获取数据，官网链接：LDC官网

方法2：关注公众号，回复CSLU: Portland Cellular Telephone Speech Version 1.3LDC语料小助手https://mp.weixin.qq.com/s/8GgZFh9XAr7FYwivQ_ajRg

关注