21年9月28日——吴恩达课程 图像增强
在课程的第一周,我们选择用2000个subset来训练dog ves cat的模型,得出的结果出现了过拟合,即训练的acc很高,但是在验证集上的acc不高,就说明数据量不够,如果数据本身很难很难采集的话,可以使用翻转、改变亮度、添加噪声等操作来扩充数据量。
这里补充一下,欠拟合一般是模型太过于简单导致的。
实际上对过拟合简单的解释就是数据量太少,我见过的东西就是训练集里的,遇到其他我没见过的就无法判别,即在验证集中表现不好。
在之前的模型中我们使用了ImageDataGenerator(rescale=1./255)
这行代码将图像进行了标准化,标准化意义是使得图片更加可控更容易处理。这里其实我们已经用到了图像增强(image augmentation),接来下我们通过图像增强来扩充数据集。
其中,width_shift_range
是指左右平移图像,shear_range
指的是倾斜变形。