librispeech 的train-clean-100--简单记录笔记

最新推荐文章于 2024-02-18 22:38:36 发布

Wsyoneself

最新推荐文章于 2024-02-18 22:38:36 发布

阅读量948

点赞数 1

分类专栏： dataset 文章标签：语音识别人工智能

本文链接：https://blog.csdn.net/weixin_45647721/article/details/127712078

版权

dataset 专栏收录该内容

10 篇文章 2 订阅

订阅专栏

LibriSpeech ：

是一个阅读语音语料库，基于 LibriVox 的公共领域有声读物。其目的是实现自动语音识别 (ASR) 系统的训练和测试
语料库被分成了一些子集，名称中带有“clean”的子集被认为比其他音频和美国英语口音更“干净”（至少平均而言）。该分类是使用非常粗糙的自动化手段获得的，不应被认为是完全可靠的。子集是不相交的，即每个说话者的音频都被分配给一个子集。

语料库的架构：

* dev-clean, test-clean - 包含“干净”语音的开发和测试集。

* train-clean-100 - 训练集，大约 100 小时的“干净”语音

* train-clean-360 - 训练集，大约 360 小时的“干净”语音

* dev-other, test-other - 开发和测试集，语音被自动选择为更具“挑战性”的识别

* train-other-500 - 大约 500 小时的训练集，包含未被归类为“干净”的语音

* intro - subset  仅包含一些读者的 LibriVox 介绍免责声明的子集

* mp3  - 语料库所基于的原始 MP3 编码音频

* texts - 语料库中音频所对应的文本