神经网络优化的方法

最新推荐文章于 2024-05-17 19:04:26 发布

田田天天甜甜

最新推荐文章于 2024-05-17 19:04:26 发布

阅读量1.9k

点赞数

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39751437/article/details/88541337

版权

文章目录

一、概述
二、优化网络的方法

一、概述

神经网络训练好之后，只有通过优化才能达到我们想要的效果，也就是我们说的调参，使参数更加准确的更新。
神经网络训练过程一般为两个阶段：

第一个阶段先通过前向传播算法计算得到预测值，并将预测值与真实值作比较，得出两者之间的差距。
第二个阶段通过反向传播算法计算损失函数对每一个参数的梯度，再根据梯度和学习率使用梯度下降算法更新每一个参数。

二、优化网络的方法

1、学习率的优化

每一个参数对目标函数的依赖不同，有的参数已经优化到了极小值附近，有的参数仍然有很大的梯度，所以不能使用统一学习率，学习率太小，会有一个很慢的收敛速度，学习率很大，会使已经优化的差不多的参数不稳定，一般合理的做法是对每一个参数设置不同的学习率。有三种不同自适应学习率优化算法

AdaGrad
AdaGrad算法，独立地适应所有模型参数的学习率，缩放每个参数反比于其所有梯度历史平均值总和的平方根。具有代价函数最大梯度的参数相应地有个快速下降的学习率，而具有小梯度的参数在学习率上有相对较小的下降。
RMSProp
RMSProp算法修改了AdaGrad的梯度积累为指数加权的移动平均，使得其在非凸设定下效果更好。
Adam

学习率的独立设置
指数衰减的学习率
指数衰减学习率是先使用较大的学习率来快速得到一个较优的解，然后随着迭代的继续,逐步减小学习率，使得模型在训练后期更加稳定。

最低0.47元/天解锁文章

田田天天甜甜

关注

0
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
神经网络优化的方法

一、概述二、优化网络的方法1、学习率的优化2、梯度下降的优化3、欠拟合和过拟合的优化Dropout为了防止神经网络的过拟合。它的主要思想是让隐藏层的节点在每次迭代时(包括正向和反向传播)有一定几率(keep-prob)失效。这样来预防过拟合。它主要避免对某个节点的强依赖，让反向传播的修正值可以更加平衡的分布到各个参数上（1）Dropout只发生在模型的训练阶段，预测、测试阶段则不...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。