优化器

最新推荐文章于 2024-01-24 17:55:55 发布

Dovy

最新推荐文章于 2024-01-24 17:55:55 发布

阅读量273

点赞数

分类专栏： AI

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Simplify_boy/article/details/108326231

版权

AI 专栏收录该内容

6 篇文章

订阅专栏

优化器

SGD

$W_{new}=W_{old} - \alpha\frac{\partial{Loss}}{\partial{W_{old}}}$

$\alpha$ :学习率
缺点：容易陷入局部极小值
加入动量（Momentum），解决局部极小值。

SGD+Momentum

Momentum更新： $V_{new}=\eta V_{old} +\alpha \frac{\partial{Loss}}{W_{old}}$

更新公式： $W_{new} = W_{old}-V_{new}$

$\alpha$ :学习率
$\eta$ :动量系数
优点：防止陷入局部极小值，由于动量由历史积累，使得收敛速度快。
缺点：容易震荡

NAG（Nesterov加速梯度）

Momentum完全展开公式： $W_{new} = W_{old}- \eta V_{old}-\alpha \frac{\partial{Loss}}{W_{old}}$
$\alpha \frac{\partial{Loss}}{W_{old}}$ 是个很小的值，未来位置权重：
$W_{future}=W_{old}-\eta V_{old}$

Nesterov Momentum公式 $V_{new}=\eta V_{old}+\alpha \frac{\partial{Loss}}{W_{future}}$

更新公式： $W_{new} = W_{old}-V_{new}$

梯度更新规则
$v_t=\gamma v_{t-1}+\eta \triangledown_{\theta}(\theta-\gamma v_{t-1})$

$\theta=\theta-v_t$

Adagrad

梯度缓存更新： $Cache_{new}=Cache_{old}+(\frac{\partial{Loss}}{W_{old}})^2$
更新公式： $W_{new} = W_{old}+\frac{\alpha}{\sqrt{Cache_{new} + \epsilon}}\frac{\partial{Loss}}{W_{old}}$
缺点：缓存始终增加，学习率会降到非常低以至于训练无法有效进行，导致训练提前结束。

RMSProp

缓存更新公式： $Cache_{new}=\gamma Cache_{old}+(1-\gamma)(\frac{\partial{Loss}}{W_{old}})^2$

更新公式： $W_{new} = W_{old}+\frac{\alpha}{\sqrt{Cache_{new} + \epsilon}}\frac{\partial{Loss}}{W_{old}}$

Adam

Adam Momentum更新公式 $V_{new} = \beta_{1}V_{old}+(1-\beta_1)\frac{\partial{Loss}}{W_{old}}$

缓存更新公式： $Cache_{new}=\beta_2 Cache_{old}+(1-\beta_2)(\frac{\partial{Loss}}{W_{old}})^2$

Adam更新公式： $W_{new}=W_{old}-\frac{\alpha}{\sqrt{Cache_{new} + \epsilon}}V_{new}$

$\beta_1=0.9$ , $\beta_2=0.99$ , $\epsilon=1e-08$

博客等级

码龄8年

29
原创

8
点赞

29
收藏

151
粉丝

关注

私信

热门文章

分类专栏

C++ 12篇
ros2 1篇
深度学习 2篇
tools
linux 2篇
tensorrt 1篇
算法 1篇
统计学习 2篇
Makefile 1篇
caffe 1篇
tensorflow
python 1篇
AI 6篇
HISI
image process

最新评论

yolo5工程化
Dovy: c++部署看你自己用什么框架了，dnn我试过没有问题，其他框架应该问题也不大。关于sigmoid问题，这里是用来回归，控制预测框在anchor框内，可以看看yolov3的论文。
yolo5工程化
v2432538: 第一！必须3连！顺便问下c++那块是要往哪里部署，sigmoid不是改成silu了吗0.0
conda环境下tensorrt安装
ygfrancois: sudo pip 调用的肯定是系统的python啊，装到系统python环境里去了
conda环境下tensorrt安装
Dovy: conda list 看一下，就知道了
conda环境下tensorrt安装
ygfrancois: sudo pip install 会把包装到conda环境里去？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。