如何指导神经网络模型的调优设计？

dlphay

于 2017-10-03 11:06:22 发布

阅读量3.1k

点赞数 2

分类专栏： DL 文章标签：神经网络模型调参优化参数超参数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dlphay/article/details/78154023

版权

本文探讨了神经网络模型调优的方法，包括参数初始化、超参数设置和模型理解。介绍了如何从过拟合到优化或保持性能的演变。训练阶段分为欠拟合、刚刚好和过拟合。重点强调快速试错，合理设计LOSS，关注loss而非准确率，以及学习率的调整。模型理解技巧涉及激活层和权重矩阵的可视化，以及感受野的大小。参数初始化推荐使用Xavier和BN。最后，提供了一系列通用技巧，如ReLU激活函数、Dropout、Adam优化器等，并给出了预处理、数据洗牌和多尺度输入的建议。

摘要由CSDN通过智能技术生成

本文主要讲解一些参数初始化技巧和超参数的设置技巧，模型的理解和设计技巧，如何去指导我们对模型进行调优设计，如何从高（层数深）胖（卷积核庞大）的模型到高瘦或者矮（层数浅）瘦（卷积核较少）的模型去演变，同时性能得到优化或者保持！

训练的过程和阶段可以分为3个阶段：

欠拟合：模型没有很好地捕捉到数据特征（训练集和验证集的loss都大于0.3）。

刚刚好：模型已经完成了我们的任务，满足要求（训练集和验证集上的loss都小于0.01）。

过拟合：模型把数据学习的太彻底，以至于把噪声数据的特征也学习到了（训练集上loss小于0.01，验证集上loss大于0.3）。

遵守的基本原则:快速试错

基本流程：

1 小规模数据集和大模型

最低0.47元/天解锁文章

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。