1.分类
minist手写数据集
cirfar10,cirfar100
voc2007,voc2012
caltech101,caltech256
ImageNet
stl-10 STL-10为了发展无监督特征学习、深度学习、自我学习算法而建立的图片识别数据集。每一类有比CIFAR10更少的标定的训练样本,但有非常大的未标记样本在进行监督训练前提供给模型。主要的挑战在于好好利用未标记的数据(来源类似但分布不同于标记的数据)来建立一个有用的先验。
具体参考:https://www.cnblogs.com/zhao441354231/p/6140217.html
2.目标检测数据集
Google推出的Open Images数据集又更新了。
最新发布的Open Images V4包含190万图像、600个种类,1540万个bounding-box标注,是当前最大的带物体位置标注信息的数据集。
Open Images数据集&挑战赛:
https://storage.googleapis.com/openimages/web/index.html