五种卷积神经网络解决猫狗分类问题(一)：V1 简单线性网络

最新推荐文章于 2024-06-18 20:00:32 发布

我是一个对称矩阵

最新推荐文章于 2024-06-18 20:00:32 发布

阅读量924

点赞数

分类专栏： keras

本文链接：https://blog.csdn.net/qq_40243750/article/details/113756348

版权

keras 专栏收录该内容

11 篇文章 2 订阅

订阅专栏

版本	描述	epochs	训练精度	验证精度
V1.0	简单线性卷积神经网络	100	99%	75%
V2.0	添加了数据增强和dropout层	100	83%	83%
V3.0	使用预训练-特征提取-分步式	100	99%	90%
V4.0	使用预训练-特征提取-合并式	100	90%	90%
V5.0	使用预训练-微调模型	100	99%	94%

五种卷积神经网络解决猫狗分类问题(零)：总概要
 五种卷积神经网络解决猫狗分类问题(一)：V1 简单线性网络
 五种卷积神经网络解决猫狗分类问题(二)：V2 简单线性网络上添加数据增强和dropout层
 五种卷积神经网络解决猫狗分类问题(三)：V3 预训练-特征提取-分步式
 五种卷积神经网络解决猫狗分类问题(四)：V4 预训练-特征提取-合并式
 五种卷积神经网络解决猫狗分类问题(五)：V5 预训练-微调模型

1. 介绍

使用keras搭建简单线性网络。在猫狗数据集上训练，最终得到99%的训练精度和75%验证集精度，显然我们是想要验证集精度，但是75%不尽人意，不过我们也先来看看该方法。

2. 网络结构

网络通过卷积层、最大池化层和密集层搭建，网络结构如下：
在这里插入图片描述

3. 数据集

数据集是kaggle上的数据集，配合使用了数据生成器
关于数据生成器主要使用了keras的ImageDataGenerator类，关于该生成器给出参考文章：
1. 程序员大本营某文章
 2. 知乎某文章
 3. CSDN某文章

也可以通过自行百度和解读下方给出的完整代码来理解

4. 代码

4.1 猫狗数据集：包含25000张图像(每类别有12500张)，但是我们只用一部分图像：

猫：
    训练集：1000张(0~1000张)
    验证集：500张(1000~1500张)
    测试集：500张(1500~2000张)
狗
    训练集：1000张
    验证集：500张
    测试集：500张

文件夹结构：

--dogs-vs-cats_small
  --train
        --cats
        --dogs
  --validation
        --cats
        --dogs
  --test
        --cats
        --dogs

4.2 网络结构：通过Conv2D和MaxPooling2D则组合堆叠

from keras import layers
from keras import models

model=models.Sequential()

# block 1
model.add(layers.Conv2D(32,(3,3),activation="relu",input_shape=(150,150,3)))
model.add(layers.MaxPool2D((2,2)))

# block 2
model.add(layers.Conv2D(64,(3,3),activation="relu"))
model.add(layers.MaxPool2D((2,2)))

# block 3
model.add(layers.Conv2D(128,(3,3),activation="relu"))
model.add(layers.MaxPool2D((2,2)))

# block 4
model.add(layers.Conv2D(128,(3,3),activation="relu"))
model.add(layers.MaxPool2D((2,2)))

# output
model.add(layers.Flatten())  #展开为向量
model.add(layers.Dense(512,activation="relu"))
model.add(layers.Dense(1,activation="sigmoid"))       
          
model.summary()

4.3 配置模型(优化器)

from keras import optimizers

model.compile(loss='binary_crossentropy',
              optimizer=optimizers.RMSprop(lr=1e-4),
              metrics=['accuracy'])

4.4 数据预处理

读取图像
将JPEG解码为RGB文件
将RGB图像转为浮点数张量
将像素缩放到0~1间(归一化)

当然Keras有一个图像处理辅工具的模块，位于keras.preprocessing.image，特别是包含了ImageDataGenerator类，可以创建python生成器，将硬盘上的图像自动转换为与处理好的张量批量

from keras.preprocessing.image import ImageDataGenerator

train_datagen=ImageDataGenerator(rescale=1./255)  # 将所有图像乘以1/255缩放，归一化
validation_datagen=ImageDataGenerator(rescale=1./255)

# 参数分别指目标目录、调整为多少尺寸、batch_size、标签类型(因为使用了binary_crossentropy损失，所以需要用二进制标签)
train_generator=train_datagen.flow_from_directory(train_dir,
                                                 target_size=(150,150),
                                                  batch_size=20,
                                                  class_mode="binary"
                                                 )
validation_generator=validation_datagen.flow_from_directory(validation_dir,
                                                 target_size=(150,150), 
                                                  batch_size=20,
                                                  class_mode="binary"
                                                 )

# 查看train_generator产生的数据和标签的性质
for data_batch,labels_batch in train_generator:
    print("data batch shape:",data_batch.shape)
    print("lables batch shape:",labels_batch.shape)
    break

print的输出：

Found 2000 images belonging to 2 classes.
Found 1000 images belonging to 2 classes.
data batch shape: (20, 150, 150, 3)
lables batch shape: (20,)

4.5 开始训练

在这里传入的数据和标签不再是以前的直接传入，而是使用生成器传入。fit_generator文档
这里也介绍下其参数

fit_generator(generator,
steps_per_epoch=None, #一个epoch从generator产生的总步数,本例中一个generator是20张，故=2000/20=100，需要100次generator
epochs=1,
verbose=1, # 日志显示模式： 0 = 安静模式, 1 = 进度条, 2 = 每轮一行。
callbacks=None,
validation_data=None,
validation_steps=None, #同steps_per_epoch，仅当validation_data为生成器才可用
class_weight=None,
max_queue_size=10,
workers=1,
use_multiprocessing=False,
shuffle=True, #是否在每轮迭代之前打乱 batch 的顺序
initial_epoch=0)

history=model.fit_generator(train_generator,
                           steps_per_epoch=100,
                           epochs=30,
                           validation_data=validation_generator,
                           validation_steps=50)

4.6 保存模型

model.save("cats_and_dogs_small_1.h5")

4.7 可视化

import matplotlib.pyplot as plt
acc=history.history['accuracy']
print("训练最佳精度：",max(acc))
val_acc=history.history['val_accuracy']
print("验证最佳精度：",max(val_acc))

loss=history.history['loss']
val_loss=history.history['val_loss']

epochs=range(1,len(acc)+1)

plt.plot(epochs,acc,'bo',label='Training acc')
plt.plot(epochs,val_acc,'b',label='Validation acc')
plt.title('Training and validation accuracy')
plt.legend()  #创建图例

plt.figure()

plt.plot(epochs,loss,'bo',label='Training loss')
plt.plot(epochs,val_loss,'b',label='Validation loss')
plt.title('Training and validation loss')
plt.legend()  #创建图例

plt.show()

在这里插入图片描述

我是一个对称矩阵

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
打赏
0
评论
五种卷积神经网络解决猫狗分类问题(一)：V1 简单线性网络

五种卷积神经网络解决猫狗分类问题(零)：总概要五种卷积神经网络解决猫狗分类问题(一)：V1 简单线性网络1. 介绍使用keras搭建简单线性网络。再猫狗数据集上训练，最终得到99%的训练精度和75%验证集精度，显然我们是想要验证集精度，但是75%不尽人意，不过我们也先来看看该方法。2. 网络结构网络通过卷积层、最大池化层和密集层搭建，网络结构如下：3. 数据集数据集是kaggle上的数据集，配合使用了数据生成器关于数据生成器主要使用了keras的ImageDataGenerator类，关于
复制链接

扫一扫