常用语音数据库

最新推荐文章于 2021-03-24 21:28:02 发布

置顶 Digital-Twin

最新推荐文章于 2021-03-24 21:28:02 发布

阅读量9.8k

点赞数 9

分类专栏：学生时期-语音识别文章标签： ASR 语音识别数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cg_speech/article/details/81199734

版权

学生时期-语音识别专栏收录该内容

7 篇文章 2 订阅

订阅专栏

大多数语音识别数据集是专有的，因为这些数据对于创建该数据集的公司来说具有很大价值。因此，这部分的可用公开数据集多数比较陈旧。

【学术、陈旧】2000 HUB5 English：仅包含英语的语音数据集，百度最近的论文《深度语音：扩展端对端语音识别》使用的是这个数据集。

地址：https://catalog.ldc.upenn.edu/LDC2002T43

【学术】LibriSpeech：包含文本和语音的有声读物数据集，由近500小时的多人朗读的清晰音频组成，且包含书籍的章节结构。

地址：http://www.openslr.org/12/

【有用、学术】VoxForge：带口音的语音清洁数据集，对测试模型在不同重音或语调下的鲁棒性非常有用。

地址：http://www.voxforge.org/

【学术、经典、陈旧】TIMIT：英文语音识别数据集。

地址：https://catalog.ldc.upenn.edu/LDC93S1

【有用】CHIME：包含环境噪音的语音识别挑战赛数据集。该数据集包含真实、模拟和清洁的语音录音，具体来说，包括4个扬声器在4个有噪音环境下进行的将近9000次录音，模拟数据是将多个环境组合及在无噪音环境下记录的数据。

地址：http://spandh.dcs.shef.ac.uk/chime_challenge/data.html

TED-LIUM：TED Talk 的音频数据集，包含1495个TED演讲的录音及全文的文字稿。

地址：http://www-lium.univ-lemans.fr/en/content/ted-lium-corpus

关注

9
点赞
踩
28

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Digital-Twin CSDN认证博客专家 CSDN认证企业博客

码龄7年

17: 原创

19万+: 周排名

90万+: 总排名

5万+: 访问

: 等级

444: 积分

17: 粉丝

42: 获赞

12: 评论

154: 收藏

私信

关注

热门文章

分类专栏

最新评论

解决win10输入法卡顿问题
数据分析小龙: 暂时是不卡了，不知道是不是因为删除这个文件的元婴
kaldi-yesno例子
CSDN-Ada助手: 多亏了你这篇博客, 解决了问题: https://ask.csdn.net/questions/7993805, 请多输出高质量博客, 帮助更多的人
解决win10输入法卡顿问题
qq_49477661: 后面只能输英文，我就下了个搜狗输入法用
解决win10输入法卡顿问题
qq_49477661: 突然卡顿，不小心把windows\InputMethod\Chs路径的chs文件夹删了有影响吗
解决win10输入法卡顿问题
沐糖橙: 今天也是突然打汉字就卡顿，愁了半天，找到博主的方法，试了一下，成功了，太nb啦

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。