1.随机梯度下降算法(Stochastic Gradient Descent, SGD)
2.使用动量的随机梯度下降算法(Stochastic Gradient Descent - Momentum, SGD-M)
3.使用Nesterov动量的随机梯度下降算法(Nesterov Accelerated Gradient, NAG)
4.AdaGrad算法
5.RMSProp算法
6.Adam算法
————————————————

1.随机梯度下降算法(Stochastic Gradient Descent, SGD)
2.使用动量的随机梯度下降算法(Stochastic Gradient Descent - Momentum, SGD-M)
3.使用Nesterov动量的随机梯度下降算法(Nesterov Accelerated Gradient, NAG)
4.AdaGrad算法
5.RMSProp算法
6.Adam算法
————————————————

转载于:https://www.cnblogs.com/pengfeiz/p/11393125.html
1390
3308

被折叠的 条评论
为什么被折叠?