CNN调参技巧

MYVision_ MY视界

已于 2023-06-12 16:49:13 修改

阅读量5.3k

点赞数 3

分类专栏：深度学习文章标签： cnn 机器学习深度学习

于 2019-11-25 19:09:24 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fengshengwei3/article/details/103200779

版权

深度学习专栏收录该内容

15 篇文章 0 订阅

订阅专栏

目录

一更多优化算法

1.AdaGrad算法

4.自定义优化算法

二.激活函数

三.网络初始化

四批归一化

五数据增强

六其他调参技巧

配套视频教程

https://www.bilibili.com/video/BV1TG4y1273c/?vd_source=61ce5faa12d7097e34d6373d9f1d2e6a

0_Pytorch实战前言_哔哩哔哩_bilibili

一更多优化算法

回顾

随机梯度下降

局部极值
鞍点问题

动量梯度下降

问题

受学习率影响很大（如果学习率设置过大，收敛很慢）
每一个维度得学习率一样（a是针对全局设置得）

1.AdaGrad算法

为了解决AdaGrad分母越变越大太大导致学习率没有更新的问题，引入了RMSProp

2.RMSProp

结合上述两个算法引入了Adam算法

3.Adam

或者用自定义的优化算法

4.自定义优化算法

问题：如何选择优化算法？

答：

对于稀疏数据，使用学习率自适应方法（AdaGrid,RMSProp，Adam)
SGD通常训练时间更长，最终效果更好，但需要好的初始化和learning rate（手工设置）
需要训练较深较复杂的网络且需要快速收敛时，推荐使用Adam
AdaGrad,RMSProp,Adam是比较相近的算法，在相似情况下，表现差不多

二.激活函数

下面分别说明几种激活函数的性质

1.Sigmoid

2.Tanh

3.ReLu

4.Leaky-ReLU

5.ELU

6.maxout

问：使用这些激活函数时的技巧

答：

Relu 要小心设置learning rate
不要使用sigmoid
使用Leaky Relu， maxout ELU
可以试试tanh, 但是计算量较大，估计也难以适用

三.网络初始化

1.全不设置成固定的数，比如全部设置为0（不适用于多层网络）

2.如何分析初始化结果好不好？

查看初始化后各层的激活值分布（分布均匀则比较好，不均匀则不好）

3.均值为0，方差为0.02的正太分布初始化-tanh

4.哪种初始化方法最好？

从输入的通道数和输出通道数中随机选择一个数，然后除以输入通道数的开方。

四批归一化

为了让每一层激活之后的分布比较统一，在每一层得到激活值之后做归一化处理，控制分布在均值为0 ，方差为1 的分布上

批归一化存在的问题：当样本数量特别大的时候，在一批数据上做归一化之后的分布并不能反映总体上的分布。

为了解决这一问题，引入了另外参数（gamma-方差,byte均值)来逆归一化

五数据增强

六其他调参技巧

（1）获取更多的数据

（2）先用一个简单的网络模型，然后逐步给神经网络添加层次，这样可以避免出错

（3）紧跟最新进展，使用新方法

（4）增大训练的迭代次数（跟其他手段并行使用）

（5）尝试增加正则化项（避免过拟合）

（6）使用更多的GPU来加速训练

（7）使用可视化工具来检查中间状态

损失函数的值
梯度分布
准确率
学习率

（8）可以在标准数据集上训练，用于确认自己的网络是否错误

（9）可以先在小数据集上测试一下，达到过拟合的效果，可以验证自己的网络没问题。

（10）注意数据集要平衡分布（比如分类中正负类数量要均匀）

（11）使用预调整好的稳定模型结构

（12）Fine-tuning 基于经典网络的参数初始化参数，然后再新的网络结构上微调

MYVision_ MY视界

关注

3
点赞
踩
56

收藏

觉得还不错? 一键收藏
1
评论
CNN调参技巧

目录一更多优化算法回顾1.AdaGrad算法2.RMSProp3.Adam4.自定义优化算法二.激活函数1.Sigmoid2.Tanh3.ReLu4.Leaky-ReLU5.ELU6.maxout三.网络初始化四批归一化五数据增强六其他调参技巧一更多优化算法回顾随机梯度下降局部极值鞍点问题动量梯度下...
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。