1、Caltech-101 数据库:该数据库在2003年被发布,包括101类目标图像和1类背景图像,共102类,彩色图像较多,有部分灰度图像。总共图像数为9145(除去背景后总数为8677),每类图像数大约在31~800之间,图像大小为300×200。此数据库的特点是:每个图像只含有一个目标,且目标大都处于图像中间位置,基本上占据整个图像区域,背景相对比较简单。
http://www.vision.caltech.edu/Image_Datasets/Caltech101/
2、Caltech-256 数据库:该数据库在2006年被发布,包括256类目标图像和1类背景图像,共257类。与Caltech101相比主要变化表现在,图像总数达到30608,且每类最少含有80幅图像。
http://www.vision.caltech.edu/Image_Datasets/Caltech256/
3、Pascal VOC 数据库:Pascal VOC Challenge(Pascal是Pattern Analysis, Statistical Modeling andComputational Learnin的缩写)是非常著名的视觉目标分类、检测及分割等任务比赛。从2005年到2012年,每年举行一届比赛并公布相应的数据库,该数据
库中每幅图像含有多个类的目标,从2007年开始,每年的数据库均含有20类目标,但具体的目标数不一样。
该数据库有三个显著的特点,每张图片可能含有多类目标且每类目标可能具有多个实例;目标的大小形状位置相差非常大;图像的背景比较复杂。这些特点给识别任务带来了非常大的困难。
http://host.robots.ox.ac.uk/pascal/VOC/
4、行人检测数据库:
http://pascal.inrialpes.fr/data/human/INRIAPerson.tar 大小970M