2、最近邻分类器
接下来我们来开发一个图像分类器:最近邻分类器。这个分类器在实践中很少用,但是可以让我们对数据驱动的图像分类方法有一个概念性的理解。
图像分类样例数据集:CIFAR-10,这是一个有名的图像分类数据集。包含6万张32X32像素的小图,每张图片都标记为10个分类中的某一个(比如airplane, automobile, bird,等等)。这6万张图片已经分为两组,训练数据5万张,测试数据1万张。下面为每个分类随机展示了10张图片:
左边: CIFAR-10 数据集中的样例数据。右边: 第一列是测试数据,我们每张测试图片给出了最近邻的10张图像