keras优化算法_Keras实现两个优化器：Lookahead和LazyOptimizer

最新推荐文章于 2024-01-27 10:15:42 发布

weixin_39541600

最新推荐文章于 2024-01-27 10:15:42 发布

阅读量398

点赞数

文章标签： keras优化算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39541600/article/details/111516186

版权

最近用Keras实现了两个优化器，也算是有点实现技巧，遂放在一起写篇文章简介一下(如果只有一个的话我就不写了)。这两个优化器的名字都挺有意思的，一个是look ahead(往前看？)，一个是lazy(偷懒？)，难道是两个完全不同的优化思路么？非也非也～只能说发明者们起名字太有创意了。

Lookahead#

首先登场的是Lookahead优化器，它源于论文《Lookahead Optimizer: k steps forward, 1 step back》，是最近才提出来的优化器，有意思的是大牛Hinton和Adam的作者之一Jimmy Ba也出现在了论文作者列表当中，有这两个大神加持，这个优化器的出现便吸引了不少目光。

Lookahead的思路很朴素，准确来说它并不是一个优化器，而是一个使用现有优化器的方案。简单来说它就是下面三个步骤的循环执行：1、备份模型现有的权重$\theta$；

2、从$\theta$出发，用指定优化器更新$k$步，得到新权重$\tilde{\theta}$；

3、更新模型权重为$\theta \leftarrow \theta + \alpha\left(\tilde{\theta} - \theta\right)$。

下面则是我的Keras实现，写法在之前的《“让Keras更酷一些！”：小众的自定义优化器》一文中就提到过了，属于一种“侵入式”的写法：

用法就很简单了：

至于效果，原论文中做了不少实验，有些有轻微提高(cifar10和cifar100那两个)，有些提升还比较明显(LSTM做语言模型那个)

最低0.47元/天解锁文章

weixin_39541600

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
keras优化算法_Keras实现两个优化器：Lookahead和LazyOptimizer

最近用Keras实现了两个优化器，也算是有点实现技巧，遂放在一起写篇文章简介一下(如果只有一个的话我就不写了)。这两个优化器的名字都挺有意思的，一个是look ahead(往前看？)，一个是lazy(偷懒？)，难道是两个完全不同的优化思路么？非也非也～只能说发明者们起名字太有创意了。Lookahead#首先登场的是Lookahead优化器，它源于论文《Lookahead Optimizer: k ...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。