梯度下降法

最新推荐文章于 2024-07-12 23:13:44 发布

phychaos

最新推荐文章于 2024-07-12 23:13:44 发布

阅读量206

点赞数

文章标签：神经网络优化算法

本文链接：https://blog.csdn.net/l090121326/article/details/83418215

版权

梯度下降法
优化算法

梯度下降法

随机梯度下降法

批梯度下降法

$g_k = f_k'(x)$
$x_{k+1} = x_k - lr * g_k$

小批梯度下降法

优化算法

动量

$g_k = f_k'(x)$
$v_k = \alpha v_{k-1} -lr*g_k$
$x_{k+1} = x_k +v_k = x_k+\alpha v_k - lr*g_{k-1}$

Nesterow 动量

$g_k = f_k'(x+\alpha v_k)$
$v_k = \alpha v_{k-1} -lr*g_k$
$x_{k+1} = x_k +v_k = x_k+\alpha v_k - lr*g_{k-1}$

AdaGrad

$g_k = f_k'(x)$
$r_k = r_{k-1}+g*g$
$x_{k+1} = x_k - \frac{lr}{\delta+\sqrt r_k} * g_k$

RMSProp

$g_k = f_k'(x)$
$r_k = \rho r_{k-1}+(1-\rho)g*g$
$x_{k+1} = x_k - \frac{lr}{\delta+\sqrt r_k} * g_k$

Adam

$g_k = f_k'(x)$
$s_k = \rho_1 s_{k-1}+(1-\rho_1)g$
$r_k = \rho_2 r_{k-1}+(1-\rho_2)g*g$
$\hat s = \frac {s}{1-\rho_1^k}$
$\hat r = \frac {r}{1-\rho_2^k}$
$x_{k+1} = x_k - \frac{lr \hat s_k}{\delta+\sqrt {\hat r_k}}$

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

phychaos

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
梯度下降法

梯度下降法随机梯度下降法批梯度下降法小批梯度下降法优化算法动量Nesterow 动量AdaGradRMSPropAdam梯度下降法随机梯度下降法批梯度下降法gk=fk′(x)g_k = f_k&amp;#x27;(x)gk=fk′(x)xk+1=xk−lr∗gkx_{k+1} = x_k - lr * g_kxk+1=xk−lr∗gk小批梯度下降法优化算法动量gk=f...
复制链接

扫一扫