深度学习系列(七) 优化算法(梯度下降、动量法、AdaGrad算法、RMSProp算法、AdaDelta算法、Adam算法) 2020.6.24

本文详细介绍了深度学习中常见的优化算法,包括梯度下降、随机梯度下降、小批量随机梯度下降、动量法、AdaGrad、RMSProp、AdaDelta和Adam算法,探讨了这些算法在处理局部最小值和鞍点等问题上的策略,以优化模型的训练过程。
摘要由CSDN通过智能技术生成

前言

在训练模型时,会使⽤优化算法不断迭代模型参数以降低模型损失函数的值
本节详细学习常用的优化算法

  • 梯度下降
  • 动量法
  • AdaGrad算法
  • RMSProp算法
  • AdaDelta算法
  • Adam算法

1、优化算法的挑战

优化算法的⽬标函数通常是⼀个基于训练数据集的损失函数
优化的⽬标在于降低训练误差

通常会遇上两个挑战

  • 局部最小值
  • 鞍点
局部最小值
  • 如果f(x)在x上的值⽐在x邻近的其他点的值更小,那么f(x)可能是⼀个局部最小值(local minimum)
  • 如果f(x)在x上的值是⽬标函数在整个定义域上的最小值,那么f(x)是全局最小值(global minimum)

在这里插入图片描述
当⼀个优化问题的数值解在局部最优解附近时,由于⽬标函数有关解的梯度接近或变成零,最终迭代求得的数值解可能只令⽬标函数局部最小化而⾮全局最小化

鞍点

梯度接近或变成零也可能是由于当前解在鞍点(saddle point)附近在这里插入图片描述
如果在深度学习训练过程中,损失函数落到了局部最小值和鞍点上&

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值