Gradient Descent（Tips1 tuning learning rates）

最新推荐文章于 2022-04-27 15:21:18 发布

Nismilesucc

最新推荐文章于 2022-04-27 15:21:18 发布

阅读量171

点赞数

分类专栏： machine learning

HUIKI

本文链接：https://blog.csdn.net/Nismilesucc/article/details/105368261

版权

machine learning 专栏收录该内容

15 篇文章 0 订阅

订阅专栏

Tuning your learning rates

注：Learning rate即为移动一步的步幅

Gradient方向和Movement方向始终是相反的，因为：

绿色，当learning rate太大时，一开始下降得很快，但是很快就会被卡住

蓝色，当learning rate太小时，下降的速度很慢，如果给足够的时间，是可以走到最低点的，但是这个时间是难以忍受的

众所周知，要不断的手动调learning rate很麻烦,我们能不能想办法让它自己调呢？

Adaptive Learning Rate

自适应梯度算法

梯度下降优化算法：

Adagrad

the previous derivatives：之前算过的那些微分值（所有）

Adagrad整体而言是会越来越慢的，这只是最简单最的一种方法。还有Adem,Adaboost等等。

在做一般的Gradient Descent的时候

问题：为什么要造成反差？如何理解？

结论：Gradient（斜率）的值越大，离最低点的距离越远

当考虑多个参数时：

Gradient的值越大就不见得跟最低点的距离越远，在有多个参数时，就不一定成立了
关于a,b,c,d四个点

上图，我们考虑 $w_1$ 的变化，a点的gradient值更大，且a点里最低点的距离更远是成立的

如果我们同时考虑 $w_2$ 的变化，c的gradient值比d大大，且c点里最低点的距离比d更远是成立的

but,如果我们比较的是跨参数的a点和c点呢？你又能如何作比较？

以上结论就不成立了，事实上虽然a点的gradient值比c小，但确实是a点离最低点更远，由此以上结论不再适用，于是我们引入second derivative（二阶偏微分）

上式的二次微分是2a(分母),最好是要把二次微分考虑进来

在 $w_1$ 方向上，smaller second,比较平滑，一次比较小，二次也比较小，于是两者相比，就可以作为衡量标准

在 $w_2$ 方向上，larger second,比较陡峭

光比较a和b的微分值是不够的，要把二次微分考虑进去做平减，除以它的二阶偏微分，才能真正更好的表示当前点到最低点的距离

和Adagrad式子联系起来：

参数的update量如下：

在sample点数量很多的情况下，你是可以在一次微分上面做sampling求得二次微分的近似值。

这里我们只是近似把分母作为second derivative，是在不增加计算量下的一种近似。当然你可以直接去算二次微分…但当参数很多的时候，算一次就很难了，你真的很难去算二次微分。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Gradient Descent（Tips1 tuning learning rates）

Tuning your learning rates注：Learning rate即为移动一步的步幅Gradient方向和Movement方向始终是相反的，因为：绿色，当learning rate太大时，一开始下降得很快，但是很快就会被卡住蓝色，当learning rate太小时，下降的速度很慢，如果给足够的时间，是可以走到最低点的，但是这个时间是难以忍受的众所周知，要不断的手动调l...
复制链接

扫一扫

专栏目录

Nismilesucc CSDN认证博客专家 CSDN认证企业博客

码龄5年

184: 原创

23万+: 周排名

193万+: 总排名

24万+: 访问

: 等级

2286: 积分

68: 粉丝

157: 获赞

59: 评论

828: 收藏

私信

关注

热门文章

分类专栏

环境配置 25篇
论文笔记 11篇
Paper 7篇
图像处理 7篇
杂记 9篇
SLAM 7篇
Computer Vision 8篇
Linux 7篇
machine learning 15篇
算法竞赛知识点整理 40篇
python 14篇

最新评论

Linux安装 metashape
qq_44797111: 软件崩溃了是啥原因
Ubuntu20.04安装CUDNN、Ceres和Colmap
黎泉: CMake Error at CMakeLists.txt:176 (add_subdirectory): The source directory /home/robotic-arm/3dgs/ceres-solver/third_party/abseil-cpp does not contain a CMakeLists.txt file.
一些cmake error fixed
不要辣椒油丶丶: 安装好之后还是不行，不知道咋解决： UserWarning: CUDA extension svox2.csrc could not be loaded! Operations will be slow. Please do not import svox in the svox2 source directory. warn("CUDA extension svox2.csrc could not be loaded! " + 晕死了，看看博主方不方便教教我
Linux安装 metashape
彬-: 求助下，破解文件在哪里获取的呢
DeepForest调试记录
ltandinG: 请问使用deepforest 对numpy版本有要求吗？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。