基于卷积神经网络的CIFAR10图像分类训练
一、数据集介绍
CIFAR10是一个用于图像识别的10分类彩色数据集,每张图片32x32的像素,每种对应有6000张图片,共60000张的数据中50000张训练集和10000张测试集。
二、基础模型
采用简单网络结构,卷积核大小统一采用3*3,具体如下:
第一层:32个卷积核的卷积层、dropout层(0.3)、池化层
第二层:64个卷积核的卷积层、dropout层(0.3)、池化层
全连接层及输出层
**epochs=40,batch_size=128**
,训练结果如下:
- 结论:训练集上达到97%时,测试集仅72.3%,模型明显过拟合,针对这个问题进行改进。
三、模型优化与数据处理
1. 数据增强
datagen = tf.keras.preprocessing.image.ImageDataGenerator(rescale=None,rotation_range=15,width_shift_range=0.1,
height_shift_range=0.1,shear_range=0.1zoom_range=0.1,
horizontal_flip=True,fill_mode='nearest')
datagen.fit(x_img_train)
2. 网络结构优化
- 新增64核卷积层、128核卷积层、256核卷积层各一层
- 各层网络中间增加几层dropout防止过拟合
model = tf.keras.Sequential()
model.add(tf.keras.layers.Conv2D(filters=64,kernel_size=(3,3),input_shape=(32,32,3),padding='same',
activation='relu',strides=(1,1)))
model.add(tf.keras.layers.Conv2D(filters=64,kernel_size=(3,3),activation='relu',padding='same'))
model.add(tf.keras.layers.Dropout(rate=0.2))
model.add(tf.keras.layers.MaxPooling2D(pool_size=(2,2)))
model.add(tf.keras.layers.Conv2D(filters=64,kernel_size=(3,3),activation='relu',padding='same'))
model.add(tf.keras.layers.Dropout(rate=0.2))
model.add(tf.keras.layers.MaxPooling2D(pool_size=(2,2)))
model.add(tf.keras.layers.Conv2D(filters=128,kernel_size=(3,3),activation='relu',padding='same'))
model.add(tf.keras.layers.Dropout(rate=0.4))
model.add(tf.keras.layers.MaxPooling2D(pool_size=(2,2)))
model.add(tf.keras.layers.Conv2D(filters=128,kernel_size=(3,3),activation='relu',padding='same'))
model.add(tf.keras.layers.Dropout(rate=0.4))
model.add(tf.keras.layers.MaxPooling2D(pool_size=(2,2)))
model.add(tf.keras.layers.Conv2D(filters=256,kernel_size=(3,3),activation='relu',padding='same'))
model.add(tf.keras.layers.Dropout(rate=0.4))
model.add(tf.keras.layers.MaxPooling2D(pool_size=(2,2)))
model.add(tf.keras.layers.Flatten())
model.add(tf.keras.layers.Dropout(rate=0.4))
model.add(tf.keras.layers.Dense(1024,activation='relu'))
model.add(tf.keras.layers.Dense(10,activation='softmax'))
3. 模型训练
**epochs=40,batch_size=128**
训练结束后训练集准确率仅89%,故提高epochs至100,训练结果如下:
- epochs与val_accuracy的相关性如图:
由上图可以看出,当epochs=40左右时,val_accuracy已达到饱和,再提高epochs对于模型准确率的作用不大。
四、安装
第1步:从Github克隆代码
git clone https://github.com/Jenn226/CIFAR10-CNN.git
第2步:安装环境
tensorflow2.9.1(采用2.1.x以上版本即可)
matplotlib3.6.2(用于训练数据可视化,选择性安装即可)
python3.10.6(采用3.7.x以上版本即可)