引言
任务介绍
图像分类是根据图像的语义信息将不同类别图像区分开来,是计算机视觉中重要的基本问题,图像分类的挑战在于相似的视觉特性,不同的语义概念以及不相似的视觉特性,相同的语义概念。
猫狗分类属于图像分类中的粗粒度分类问题。
实践平台:百度AI实训平台AI-STUDIO。
任务目标
构建一个模型,根据鸢尾花的花萼和花瓣大小将其分为三种不同的品种。
模型选择
卷积神经网络(CNN)
卷积层:执行卷积操作提取底层到高层的特征,发掘出图片“局部特性”;
池化层:通过降采样的方式,在不影响图像质量的情况下,压缩图片,减少参数;
全连接层:池化完成后,将数据“拍平”,丢到Flatten层,然后把Flatten层的输出放到全连接层里,可采用softmax对其进行分类。
数据集
CIFAR-10数据集
cifar-10共60000张彩色图像,图像大小为3通道的32*32,分为10类,每类6000张
训练集:50000张用于训练,构成5个训练批,每批10000张图
测试集:其余10000张用于测试,单独成一批。
测试集从每类中随机取1000张