AI最全数据集汇总：语音、歌声、音乐、图片、视频等领域开源数据集链接汇总

小码蚁.

于 2020-04-12 23:00:25 发布

阅读量3.2k

点赞数 2

分类专栏：歌声合成从入门到实战（含实例）语音合成原理与算法实战解读机器学习、深度学习实例讲解与分析

禁止转载

本文链接：https://blog.csdn.net/weixin_32393347/article/details/105478567

版权

机器学习、深度学习实例讲解与分析同时被 3 个专栏收录

193 篇文章 82 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

歌声合成从入门到实战（含实例）

104 篇文章 123 订阅 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

语音合成原理与算法实战解读

16 篇文章 71 订阅 ¥29.90 ¥99.00

订阅专栏

文章目录

音乐数据集

免费音乐档案 https://github.com/mdeff/fma
FMA是音乐分析的数据集。数据集由全长和HQ音频，预先计算的功能以及跟踪和用户级元数据组成。它是一个开放的数据集，用于评估音乐信息检索（MIR）中的几个任务。
- https://en.wikipedia.org/wiki/Music_information_retrieval
  这个巨大的，几乎1000 GB的大小。

百万歌数据集

https://labrosa.ee.columbia.edu/millionsong/

百万歌数据集是一个免费提供的音频功能和元数据的集合，为一百万当代流行音乐曲目。数据集的核心是100万首歌曲的特征分析和元数据。数据集不包含任何音频，仅包含派生特征。可以使用哥伦比亚大学提供的代码从7digital等服务中获取样本音频。此数据集的大小约为280 GB。

语音数据集

免费口语数字数据集

https://github.com/Jakobovski/free-spoken-digit-dataset

创建这个是为了解决识别音频样本中的语音数字的任务。这是一个开放的数据集，所以希望它会随着人们不断提供更多样本而不断增长。目前，它包含以下特征：1）3个扬声器2）1,500个录音（每个扬声器每个数字50个）3）英语发音。这是一个非常小的设置 - 大小约为10 MB。

LibriSpeech

http://www.openslr.org/12/

该数据

了解本专栏

超级会员免费看

关注

2
点赞
踩
28

收藏

觉得还不错? 一键收藏
打赏
2
评论
AI最全数据集汇总：语音、歌声、音乐、图片、视频等领域开源数据集链接汇总

文章目录**音乐数据集**百万歌数据集**语音数据集**口语维基百科语料库语音命令数据集零资源语音挑战ISOLET数据集阿拉伯语言语料库TIMIT语料库**音响/自然**环境音频数据集城市声音分类城市声音数据集鸟类音频检测挑战中文文本分类数据集THUCNews中文完形填空数据集清华大学开放中文词库中华古诗词数据库上百种预训练中文词向量《口袋妖怪》跨语种命名对照数据集中文突发事件语料库中国股市爬取信...
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

小码蚁. 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。