根据网上的资料,一位外国小哥整理的图像数据集博客,整理该篇博文。原文地址如下:
Who is the best at X ?
http://rodrigob.github.io/are_we_there_yet/build/#datasets
图像处理任务,以下5类
- 分类
- 目标识别
- 姿势分析
- 语义标注
- 图像分割
1. 分类
- MNIST 手写数字识别28*28
- cifar10 10分类,输入28283
- cifar100 100分类,输入28283
- STL-10 10分类,输入96963
- SVHN 街道路牌数字识别
- ILSVRC2012 task 1,1000个分类识别
2.目标识别
- Pascal VOC 2007 comp3
- Pascal VOC 2007 comp4
- Pascal VOC 2010 comp3
- Pascal VOC 2010 comp4
- Pascal VOC 2011 comp3
以上5个数据集,考察mAP(不同类别的AP的均值) - Caltech Pedestrians USA 加州理工行人检测
- INRIA Person 法国国家信息与自动化研究所 人识别
- ETH Pedestrian苏黎世联邦理工学院 行人数据集
- TUD-Brussels Pedestrian 布鲁塞尔都柏林大学行人数据集
- Daimler Pedestrian 戴勒姆行人数据
- KITTI Vision Benchmark 德国卡尔斯鲁厄理工学院自动驾驶数据集
3.姿势分析
- Leeds Sport Poses 利兹大学体育姿势数据集
4语义标注
5.图像分割
-Salient Object Detection benchmark 南开大学显著性检测算法