keras做CNN的训练误差loss的下降

最新推荐文章于 2021-11-22 22:25:32 发布

fitzgerald0

最新推荐文章于 2021-11-22 22:25:32 发布

阅读量1.3w

点赞数 2

分类专栏：机器学习

本文链接：https://blog.csdn.net/fitzgerald0/article/details/79002018

版权

机器学习专栏收录该内容

27 篇文章 13 订阅

订阅专栏

采用二值判断如果确认是噪声，用该点上面一个灰度进行替换。

噪声点处理：对原点周围的八个点进行扫描，比较。当该点像素值与周围8个点的值小于N时，此点为噪点。

处理后的文件大小只有原文件小的三分之一，前后的图片内容肉眼几乎无法察觉。

但是这样处理后图片放入CNN中在其他条件不变的情况下，模型loss无法下降，二分类图片，loss一直在8-9之间。准确率维持在0.5,同时，测试集的训练误差持续下降，但是准确率也在0.5徘徊。大概真是需要误差，让优化方法从局部最优跳出来。

使用的activation function是relu，full connection layer是softmax分类函数，优化方法为RMsprop

难到是需要加入噪音更好，CNN中加入高斯噪音不是让模型更稳健的吗？还有让模型跳出局部最优的好处，方便训练。

原意：降噪的目的是因为这批数据是样本较少，用复印机扫面出来的图片，想着放入更干净的数据，模型更容易学习到本质特征。

结果事与愿违，但是在keras中是可以加入noise的，比如加入高斯噪音

form keras.layers.noise import GaussianNoise

我在全连接层中加入

model.add(GaussianNoise(0.125))

后来查看了BatchNormalization的作用，发现在这个大杀器之后，好像很少有人用到初始化和其他的tricks，就可以让模型表现的很好。

在第一层的Maxpooling后面加上，model.add(BatchNormalization())，效果非常显著，第一次epoch的loss值只有0.63，acc也迅速上升，不会出现之前的卡在8.354一直不动，哪怕更换 leraning rate和使用Adagrad，都是一样的，如果前面的5个epoch完，还是没有太大的变化，后面几乎不会收敛。

1，leraning rate的设置

#导入模块，以rmsprop为例

from keras.optimizers import rmsprop

rmsprop=rmsprop(lr=0.1)#只是更改了学习率，其他的参数没有更改，默认学习率是0.001

2.BatchNormalization()的设置

from keras.layers.normalization import BatchNormalization

#网上不少人说，批规范化加在输入层的激活函数（层）的前面

model.add(BatchNormalization())

也有看到每一个隐藏层的激活函数前面全部加上BN的，但是我这个实验中，效果很差。

3.在输入数据的时候，依然加上train_x = data/255.0，对像素矩阵的取值放小到0-1之间，否则训练将很艰难。

其实在我自己的实验中，后来调整成：

train_x-= np.mean(train_x, axis = 0)

发现效果更好

4.如果第一次的epoch的loss在个位数，则很可能需要返回去重新构建模型，加入更多的trick，如果最后的loss值依然没有达到小数，则也可能是难于训练，也需要加入其他的技巧。或者模型搭建的有问题，需要慎重检查。

5. 建议使用网格搜索，从最重要的参数开始，搭建一个简单的模型，然后取合理的超参数，逐一进行。

6 .也可以在卷积层中加正则化，比如：

C1 = Convolution2D(8 3, 3, border_mode='valid', init='he_uniform', activation='relu',W_regularizer=l2(regularizer_params))

7.有看到在kaggle中使用集成cnn的，分类错误率确实有下降。

8 使用ReduceLROnPlateau 对学习率进行衰减，当下降很慢时，学习率自动调整，可以起到一部分作用，

我在模型中使用的是RMSprop ，RMSprop本身带有学习率的自动调整，但是，我加上ReduceLROnPlateau ，依然可以看到学习率变化很慢时，设置的这个ReduceLROnPlateau 有调整。

9 用数据增强的时候，也需要小心，图片调整的幅度等均会对模型的正确率有影响。

10，对3个颜色的图像转换为gray以后，分类准确率稳定在 0.5左右，几乎就是废掉了，说明图像的像素对于模型的影响巨大，后来了解到有“图像超分辨率重建Super-Resolution”其实是可以对图像做像素的分辨率更高。当然也是可以手工用PS进行插值等修图。查了下，像mnist这样的数据集都是经过处理后才放入模型中的，所以，不能完全指望着CNN卷积池化就把所有的问题都解决掉，尽管图像分类和识别正在像CNN转移。

keras遇到的坑（可能是水平的问题，总之有困惑）

(1)多次运行会在上一次运行过的数据上起作用，比如，

train_x , val_x , train_y, val_y = train_test_split(train_x, train_y, test_size=0.1, random_state=random_seed)

如果多次运行，则1000个数据，900个训练集的，下一次变成，900*0.9=810个数据，同时，还发现，

train_y = to_categorical(label, num_classes =2)，这里也可能出现问题，比如，二分类，在第一次运行后是，2行

第二次运行就变成4行

(2),在做交叉验证时

新版本epoch的写法是epochs=

estimator = KerasClassifier(build_fn=baseline_model, epochs=20, batch_size=32, verbose=2)

如果用成下面老版本，则n_epoch无法读取，运行的时候，默认的是1所以我定义的 n_epoch=20是失效。

estimator = KerasClassifier(build_fn=baseline_model, n_epoch=20, batch_size=32, verbose=2)

fitzgerald0

关注

2
点赞
踩
31

收藏

觉得还不错? 一键收藏
7
评论
keras做CNN的训练误差loss的下降

采用二值判断如果确认是噪声，用该点上面一个灰度进行替换。噪声点处理：对原点周围的八个点进行扫描，比较。当该点像素值与周围8个点的值小于N时，此点为噪点。处理后的文件大小只有原文件小的三分之一，前后的图片内容肉眼几乎无法察觉。但是这样处理后图片放入CNN中在其他条件不变的情况下，模型loss无法下降，二分类图片，loss一直在8-9之间。准确率维持在0.5,同时，测试集的训练误差持续下...
复制链接

扫一扫