卷积神经网络提高准确率（shuffle,优化器，batchsize,权重初始化）通过某次实际CNN调参过程

最新推荐文章于 2025-02-27 00:25:28 发布

执契

最新推荐文章于 2025-02-27 00:25:28 发布

阅读量2.6w

点赞数 27

分类专栏： # 视觉相关网络文章标签：卷积神经网络准确率 batchsize 优化器权重初始化

本文链接：https://blog.csdn.net/qq_36187544/article/details/90478051

版权

7 篇文章

订阅专栏

最近做一个CNN，从0开始调节，终于让准确率提高到了95%。

网络结构为，两层卷积，池化，两层卷积，池化，两层全连接：

打乱

1.千万要对数据进行shuffle，不然准确率低的令人发指。发现某一类别正确率极高，但是数据是平均分布的，怀疑shuffle出错，但是没有。。。

2.由于准确率一直很低，怀疑陷入局部最优，也可能是鞍点，所以采用各种优化器尝试了下，

adam结果:

理解：adam采用自适应优化，所以它的优势是训练快，但是问题在于更容易陷入局部最优、鞍点等！虽然SDG慢了点，但是真好用（所以那么多研究中都采用SDG）

SDG对应tensorflow:tf.train.GradientDescentOptimizer

ADAM对应tensorflow:tf.train.AdamOptimizer

采用SDG方法损失函数突破1.5，（ADAM为1.9）

（我这个网络的问题主要与batchsize有关，由于此参数的不合适，学习到内容过于偏离预期！）

3.batchsize，主要三个作用：

内存利用率（只要能跑就行）
跑完一次 epoch（全数据集）所需的迭代次数减少，对于相同数据量的处理速度进一步加快。但是盲目加大导致达到相同的精度，其所花费的时间大大增加了，从而对参数的修正也就显得更加缓慢。
一般来说 Batch_Size 越大，其确定的下降方向越准，引起训练震荡越小。但是Batch_Size 增大到一定程度，其确定的下降方向已经基本不再变化。也就说容易陷入局部最优（也可以理解为如果batch_size很大会导致学习到的特征偏向于整体特征，学习到的内容不够）

忽略异常的波动：发现合理减少batch-size后准确率提升了，损失函数值下降到新高度（batch-size=700时准确率不足40%，损失最低达到1.5）橙色为训练集，蓝色为验证集
batch-size=128	batch-size=32	batch-size=8