学习率的作用,学习率衰减,函数

最新推荐文章于 2024-06-24 11:38:01 发布

贾世林jiashilin

最新推荐文章于 2024-06-24 11:38:01 发布

阅读量6.8k

点赞数 4

分类专栏：深度学习相关文献和理论

本文链接：https://blog.csdn.net/qq_35290785/article/details/89847734

版权

深度学习相关文献和理论专栏收录该内容

126 篇文章 64 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

1.学习率的作用

梯度下降法是一个广泛被用来最小化模型误差的参数优化算法。梯度下降法通过多次迭代，并在每一步中最小化成本函数（cost 来估计模型的参数。学习率 (learning rate)，在迭代过程中会控制模型的学习进度。

在梯度下降法中，都是给定的统一的学习率，整个优化过程中都以确定的步长进行更新，在迭代优化的前期中，学习率较大，则前进的步长就会较长，这时便能以较快的速度进行梯度下降，而在迭代优化的后期，逐步减小学习率的值，减小步长，这样将有助于算法的收敛，更容易接近最优解。故而如何对学习率的更新成为了研究者的关注点。在模型优化中，常用到的几种学习率衰减方法有：分段常数衰减、多项式衰减、指数衰减、自然指数衰减、余弦衰减、线性余弦衰减、噪声线性余弦衰减

2.学习率衰减常用参数有哪些

参数名称	参数说明
learning_rate	初始学习率
global_step	用于衰减计算的全局步数，非负，用于逐步计算衰

了解本专栏

超级会员免费看

贾世林jiashilin

关注

4
点赞
踩
23

收藏

觉得还不错? 一键收藏
打赏
6
评论
学习率的作用,学习率衰减,函数

目录1.学习率的作用2.学习率衰减常用参数有哪些3.常见衰减函数3.1分段常数衰减3.2指数衰减3.3自然指数衰减3.4多项式衰减3.5余弦衰减1.学习率的作用梯度下降法是一个广泛被用来最小化模型误差的参数优化算法。梯度下降法通过多次迭代，并在每一步中最小化成本函数（cost 来估计模型的参数。学习率 (learning rate)，在迭代过程中会...
复制链接

扫一扫