深度学习进阶：猫狗大战完整项目（二）

最新推荐文章于 2023-05-31 17:09:32 发布

刘泽豪真讨厌

最新推荐文章于 2023-05-31 17:09:32 发布

阅读量1.1k

点赞数

分类专栏： AR深度学习项目

本文链接：https://blog.csdn.net/liu506039293/article/details/87926037

版权

本文介绍了深度学习项目中图像预处理的三种方式，包括去均值、随机裁剪和有规律的裁剪加数据增强。详细解释了去均值的目的以及随机裁剪和数据增强对模型性能的提升。同时，阐述了HDF5数据集的载入过程，包括调用参数、数据预处理列表和数据增强选项。讨论了batchSize和epochs的影响，指出它们对训练过程和性能的重要性，并预告后续将对超参数进行实验研究。

摘要由CSDN通过智能技术生成

前面配置好了环境并且将数据集转换成了HDF5格式。这一节要编写图片预处理脚本，并且学习HDF5格式的载入。

三种预处理方式

1.去均值

去均值预处理的意思是，计算训练集中所有图片通道均值，然后每张图片每个像素去减去这个均值。作用的话书上说是为了去除光照的影响，我也没搞懂为什么这样就能去除光照的影响了。这里的均值不是指图像本身的均值而是整个训练集的均值啊，难道意思是减少不同图像之间光照的影响？留个问题去问老师。
在这里插入图片描述

2.裁剪图片到合适的大小

这里采用随机裁剪的方法，比如将256×256的图片随机裁剪到277×227。
在这里插入图片描述

3.裁剪加数据增强

这个目的也是裁剪，区别是它是有规律的裁剪，对一张图片的4个定点加中心点5个点作为起点裁剪，然后水平翻转。加上上面的一张随机裁剪，一张图片变成了11张图片，顺便进行了数据增强。能提升1%-2%的分类准确度。
在这里插入图片描述

HDF5数据载入

首先是HDF5调用和实现

trainGen = HDF5DatasetGenerator(config.TRAIN_HDF5, 32, aug=aug,
	preprocessors=[pp, mp, iap], classes=2)#128

# import the necessary packages
from keras.utils import np_utils
import numpy as np
import h5py

class HDF5DatasetGenerator:
	def __init__(self, dbPath, batchSize, preprocessors