我们采用的是101_ObjectCategories这个数据集(这里是其主页,你也可以在这里获得数据集以及我的代码),这个数据集是加州理工的一个数据集,里面有101个文件夹,每个文件夹的名字是一个物体,文件夹内有几十张上百张这个物体的图像,每个图像的大小不尽相同,总共才100多MB,比较好训练,有一个同类的数据集,它还有有200多个物体的一个数据集,但是有几个G,所以不太适合了。相对于MNIST数据集来说,用matlab的话,MNIST数据集显得更难读取了,因此也不选用MNIST数据集。
需要注意的是,这个101_ObjectCategories数据集好像有102个文件夹,我删去了一个文件夹BACKGROUND_Google,顾名思义是Google的背景,但是里面的图片非常杂乱,根本看不出有什么联系,所以这个文件夹应该被删除。
首先要能读取这个图像,采用下面语句:
img = imread('101_ObjectCategories/accordion/image_0001.jpg');
image(img);
就可以显示图像了: