退化学习率——在训练速度和精度之间找到平衡

最新推荐文章于 2023-06-16 00:00:12 发布

chengqiuming

最新推荐文章于 2023-06-16 00:00:12 发布

阅读量2.6k

点赞数 1

分类专栏：人工智能文章标签：学习率

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chengqiuming/article/details/80199385

版权

人工智能专栏收录该内容

91 篇文章 4 订阅

订阅专栏

每一个优化器的第一个参数learning_rate代表学习率。

设置学习率的大小，是在精度和速度之间找到一个平衡点。

如果学习率比较大，则训练速度会提升，但结果的精度不够。
如果学习率比较小，精度虽然提升了，但训练会耗费太多的时间。

下面介绍设置学习率的方法——退化学习率。

退化学习率又叫学习率衰减，它的本意是希望在训练过程中对于学习率大和小的优点能够为我们所用，也就是当训练刚开始时，使用大的学习率加快速度，训练到一定程度后使用小的学习率来提高精度，这时可以使用学习率衰减的方法：

def exponential_decay(learning_rate, global_step, decay_steps,decay_rate,staircase=False,name=None):

学习率的衰减速度是由 global_step和 decay_steps来决定的。

具体计算公式如下：

decayed_learning_rate=learning_rate* decay_rate^( global_step/ decay_steps )

staircase值默认是False。当未True时，将没有衰减功能，只是使用上面的公式初始化一个学习率的值而已。

例如下面代码：

learning_rate = tf.train.exponential_decay(initial_learning_rate, global_step, decay_steps=10000,decay_rate=0.96)

这种方式定义的学习率就是退化学习率，它的意思是当前迭代到 global_step步，学习率每一步都按照每10万步缩小到96%的速度衰退。

有时还需要对已经训练好的模型进行微调，可以指定不同层使用不同的学习率。

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
退化学习率——在训练速度和精度之间找到平衡

每一个优化器的第一个参数learning_rate代表学习率。设置学习率的大小，是在精度和速度之间找到一个平衡点。如果学习率比较大，则训练速度会提升，但结果的精度不够。如果学习率比较小，精度虽然提升了，但训练会耗费太多的时间。下面介绍设置学习率的方法——退化学习率。退化学习率又叫学习率衰减，它的本意是希望在训练过程中对于学习率大和小的优点能够为我们所用，也就是当训练刚开始时，使用大的学习率加快速度...
复制链接

扫一扫

专栏目录

chengqiuming CSDN认证博客专家 CSDN认证企业博客

码龄8年

6005: 原创

2万+: 周排名

145万+: 总排名

1140万+: 访问

: 等级

12万+: 积分

3716: 粉丝

3504: 获赞

1163: 评论

1万+: 收藏

私信

关注

热门文章

分类专栏

最新评论

C++关于线程栈尺寸实战
hhhhhhhhhhkkkkkkkkkk: 静态数据区算是另类的堆空间，效果上相当于在main函数执行前先申请(malloc)静态数据区的空间。不随函数的退出而释放，行为与堆空间相似，区别是不能手动释放，所以也算是堆空间。
颜色的 HSL 表示
小明: 博主的文章细节很到位，兼顾实用性和可操作性，内容和细节都很到位，期待博主持续带来更多好文
JVM 垃圾回收之复制算法
hcfee: 对啊，不标记怎么确定对象是不是存活呢？看到好几个博客都写不需要标记，搞不懂
伪随机生成器具体实现——线性同余法
Eric-Xuan: 所以这个最好是让seed_value < lcg_m 来保证随机性
省市区三级联动 el-select 组件前端实现
Keep___Promise: 报错了

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。