[Keras]学习笔记(1):optimizers

翻译于 2016-04-07 13:28:12 发布 · 1k 阅读

·

1

·

文章标签：

#Keras #optimizers

Keras 专栏收录该内容

1 篇文章

订阅专栏

这篇Keras学习笔记详细介绍了随机梯度下降(SGD)，RMSprop，Adagrad，Adadelta，Adam和Adamax等优化器，包括它们的工作原理和参数设置，特别指出这些优化器在深度学习模型训练中的应用和效果。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Keras学习笔记(1):optimizers

keras.optimizers.Optimizer()

SGD（Stochastic gradient descent）

随机梯度下降

Stochastic gradient descent, with support for momentum, decay, and Nesterov momentum.

keras.optimizers.SGD(lr=0.01, momentum=0.0, decay=0.0, nesterov=False)

参数

lr : float >= 0. Learning rate.学习速率
momentum: float >= 0. Parameter updates momentum. 冲量单元
decay: float >= 0. Learning rate decay over each update.每次训练学习速率的衰减率
nesterov: boolean. Whether to apply Nesterov momentum.Nesterov 冲量单元

RMSprop

RMSProp optimizer.

It is recommended to leave the parameters of this optimizer at their default values.

This optimizer is usually a good choice for recurrent neural networks.

keras.optimizers.Adamax(lr=0.002, beta_1=0.9, beta_2=0.999, epsilon=1e-08)

参数

lr : float >= 0. Learning rate.
beta_1/beta_2: floats, 0 < beta < 1. Generally close to 1.
decay: float >= 0. Learning rate decay over each update.
nesterov: boolean. Whether to apply Nesterov momentum.

Adagrad

Adagrad optimizer.

It is recommended to leave the parameters of this optimizer at their default values.

keras.optimizers.Adagrad(lr=0.01, epsilon=1e-06)

参数

lr: float >= 0. Learning rate.
epsilon: float >= 0.

Adadelta

Adadelta optimizer.

It is recommended to leave the parameters of this optimizer at their default values.

This optimizer is usually a good choice for recurrent neural networks.

keras.optimizers.Adadelta(lr=1.0, rho=0.95, epsilon=1e-06)

参数

lr: float >= 0. Learning rate. It is recommended to leave it at the default value.
rho: float >= 0.
epsilon: float >= 0. Fuzz factor.

Adam

Adam optimizer.

Default parameters follow those provided in the original paper.

keras.optimizers.Adam(lr=0.001, beta_1=0.9, beta_2=0.999, epsilon=1e-08)

参数

lr: float >= 0. Learning rate.
beta_1/beta_2: floats, 0 < beta < 1. Generally close to 1.
epsilon: float >= 0. Fuzz factor.

Adamax

Adam optimizer.

Adamax optimizer from Adam paper’s Section 7. It is a variant of Adam based on the infinity norm.

Default parameters follow those provided in the paper.

keras.optimizers.Adam(lr=0.001, beta_1=0.9, beta_2=0.999, epsilon=1e-08)

参数

lr: float >= 0. Learning rate.
beta_1/beta_2: floats, 0 < beta < 1. Generally close to 1.
epsilon: float >= 0. Fuzz factor.

博客等级

码龄9年

0
原创

1
点赞

2
收藏

0
粉丝

关注

私信

分类专栏

Keras 1篇

展开全部收起

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。