第二卷 第九章 Kaggle竞赛:Cat与Dog
在本章中,我们将扩展我们的工作并学习如何为HDF5数据集定义一个图像生成器,适用于使用Keras训练卷积神经网络。该生成器将打开HDF5数据集,为要训练的网络生成批量图像和相关的训练标签,并继续这样做,直到我们的模型达到足够低的损失/高精度。
为了完成这个过程,我们将首先尝试三个旨在提高分类精度的新图像预处理器——均值减法、补丁提取和裁剪。一旦我们定义了新的预处理器集,我们将继续定义实际的HDF5数据集生成器。
我们将实现AlexNet架构。然后将在KaggleDogsvs.Cats挑战中训练AlexNet。给定训练好的模型,我们将评估其在测试集上的性能,然后使用过采样方法进一步提高分类精度。
1、额外的图像处理器
(1)平均减法预处理器,旨在从输入图像(这是数据标准化的一种形式)中减去数据集中的平均红色、绿色和蓝色像素强度。
(2)一个补丁预处理器,用于在训练期间从图像中随机提取M×N个像素区域。