- MNIST:由美国人口调查局员工手写的数字。(http://yann.lecun.com/exdb/mnist/)
- ImageNet:来自图像搜索引擎的数百万张图像。(http://www.image-net.org/)
- AudioSet:用于声音分类的YouTube音频片段。(https://research.google.com/audioset/)
- Kinetics:用于人类动作分类的YouTube视频片段。(https://deepmind.com/research/open-source/kinetics)
- KITTI:由摄像机和其他传感器记录的交通场景。(http://www.cvlibs.net/datasets/kitti/)
- Amazon Review:来自亚马逊在线商店和其他来源的客户评论。(亚马逊数据集通常是从亚马逊网站和其他来源获得的,没有单独的官方网址。)
- SQuAD:从维基百科衍生的问答对。(https://rajpurkar.github.io/SQuAD-explorer/)
- LibriSpeech:1000小时的有声读物。(http://www.openslr.org/12/)
流行的机器学习数据集
于 2024-04-22 16:44:06 首次发布